当前位置: 首页 > news >正文

100个智能体实战技巧 | 如何让工作流也能处理图片

相信不少朋友都遇到过想要在工作流中处理图片但是却无从下手的情况

举个例子,扣子中有个插件叫OCR,是可以用来识别图中的文字的

图片

然而作为一个插件,它只能在工作流中被调用,如下图 工作流 vs. 图像流

图片

这就意味着,要使用OCR的插件就需要在工作流中上传图片。

然而,目前Coze中只有图像流是可以直接选择Image类型的输入参数进行图片上传,工作流里并没有这个类型选项

图片

那么问题来了,如何让工作流接收并处理图片呢?

答案就是使用提示词,不过这个提示词的用法程哥也是反复尝试了多遍,最后总结出来的。

下面程哥就用这个OCR插件来做个演示,给大家做个参考:

1. 新建一个工作流test,在开始节点中添加一个输入参数pic_url,类型选择String

2. 在工作流中添加OCR的Image2tex的插件工具,并将参数url设为引用开始节点的pic_url

图片

3. 连接各节点,试运行后发布工作流

试运行的时候需要准备一个图片的链接,作为输入参数

发布工作流并将工作流test添加到bot中

图片

4. 设置人设与回复逻辑的提示词

关键点就是:在提示词里要明确指明,将图片链接传递给工作流的输入参数

图片

5. 选择模型

程哥在做了多次尝试后发现,在这种应用场景下豆包的Function call模型工作不稳定,经常无法正常返回识别的内容。

但是通义千问-Max和GLM-4都没问题,其他模型暂时还没尝试。

6. 预览与调试

程哥上传了一张”证件照生成器“的截图,运行之后顺利识别出了图片中的文字,如下:

图片

就是这样,使用这个方法就可以让一个工作流顺利地处理图片了,快去试试吧~~

Bot体验地址:https://www.coze.cn/store/bot/7402108917955870754

如果觉得程哥的文章对你有帮助,记得点赞,转发,关注哦,你的支持是我的动力

智能体精彩内容推荐:

-> AI智能体 | 智能体综合系列

-> AI智能体 | 100个好用的智能体

-> AI智能体 | 100个智能体实战技巧

-> AI智能体 | 100个好用的智能体插件


http://www.mrgr.cn/news/5440.html

相关文章:

  • 中兴 5G CPE 3 Pro产品参数
  • Spring Cloud LoadBalancer 源码解析
  • 【UE5.1】NPC人工智能——05 给NPC添加视觉感知
  • 数采网关面临的安全挑战
  • 【3.1】贪心算法-解分发饼干
  • Windows Server查看W3SVC IIS服务器中对应的网站日志
  • centos 7.9 迁移到 openEuler22.03-LTS-SP3
  • 微信小程序电脑端和开发工具端能访问,但是手机端访问不了
  • TypeScript中的接口(Interface):对象类型的强大工具
  • 用py获取显卡的占用率
  • 全套安全帽佩戴检测算法源码与实战应用分享
  • Swift语言服务器协议(LSP)深度解析:开启Swift开发的新篇章
  • JWT-JSON Web Token
  • 成本效益分析:观测云投资的回报
  • GTK的表格宽度调节
  • 记录一个变量溢出的bug
  • Docker的概述及如何启动docker的镜像、远程管理宿主机的docker进程
  • ubuntu x86_64系统上安装运行aarch系统的虚拟机
  • C++:病毒系列回归记2/3 (Doge智能系统已上线)
  • Spring Boot 实现全局异常处理