当前位置: 首页 > news >正文

拒绝编程,dataC工作量+AI数据采集:大模型识别图片

你有没有遇到这样的情况:一个web页面内,文字看起来是正常的,但使用agent-browser节点读取其内容,发现文字的顺序是乱序的,与页面上显示的不一样。

这就是遇到了自定义字库的系统了。这种系统数据的迁移比较头痛,但在dataC来看,小菜一碟,使用大模型分析内容即可。

假设我们使用AB截图节点,将元素截图了,就可以使用以下步骤来识别图片内容。

文件读取

放入文件读写节点,如下配置。

Base64编码

放入Base64编码节点,对读取内容进行编码。

大模型理解图片内容

添加大模型节点,选择阿里百炼,然后选择图片理解方法。

在大模型属性中,如下图配置。

视觉理解目标,就是我们需要识别的图片,可以填写两种格式内容,Base64编码字符串和图片url地址。

对于本地图片文件,要么编码为Base64,要么上传到互联网上,获得url。

本例中我们采用Base64编码方式,注意内容填写格式,你可以点击右侧的按钮,快速插入格式模板,然后在末尾追加图片的Base64编码字符串。

要注意哦,图片格式为jpeg时,需要选择data:image/jpeg模板,png时,选择data:image/png模板。

用户提示词中,你可以要求大模型如何输出数据,注意看,我们定义了content,与输出参数中的名称对应。

好了,运行dataC流程,就可以得到页面内容了。

http://www.jsqmd.com/news/735290/

相关文章:

  • 基于OpenAI Function Calling的LLM工具与智能体开发实践
  • 2026年GEO搜索优化哪家强:成都GEO企业服务、成都GEO优化、成都GEO信源搭建、成都GEO全域营销、成都GEO合规优化选择指南 - 优质品牌商家
  • 手把手教你用RealSense L515获取相机内参,并生成ORB-SLAM2可用的YAML配置文件
  • Chaterm:终端AI助手部署与高效使用指南
  • 2026最权威的六大降AI率网站实际效果
  • QQ截图独立版:Windows平台高效截图与OCR识别工具完全指南
  • DiT架构在视频生成中的创新应用与实战解析
  • 2026年幸福家庭疗愈机构专业度评测与TOP推荐:心泉导师、心泉幸福家庭、心泉教育学员评价、心泉教育幸福家庭、心泉老师大爱选择指南 - 优质品牌商家
  • 使用Taotoken为Claude Code配置稳定API连接与模型选择
  • 夏季汗渍为什么洗完还会有闷味?
  • 第8篇:Vibe Coding时代:FastAPI 部署 LangGraph Agent 实战,把本地 Demo 变成可调用服务
  • 为什么你的团队还在用VS Live Share?VSCode 2026原生协作已支持离线变更同步、断网重连自动合并——实测对比报告
  • 2026年第二十三届五一数学建模竞赛-A题 煤矿巷道支护问题
  • Windows系统优化终极指南:WinUtil一站式解决方案
  • Arm架构直线推测漏洞解析与防护方案
  • Arm Cortex-A65调试架构与性能优化实战
  • 饥荒联机版私服搭建教程(Linux)
  • 5步完整破解方案:Cursor Pro永久免费使用终极指南
  • Cortex-A715核心寄存器架构与性能优化实战
  • Windows 10/11 下保姆级搭建Superset 3.0二次开发环境(含Python 3.10 + Node 16 避坑指南)
  • Windows系统缺少concrt140.dll文件无法启动程序解决
  • 【2026工业AIoT准入红线】:MCP新标强制要求的12项实时性/安全性指标,92%产线系统尚未达标!
  • Tidyverse 2.0自动化报告落地七步法:从环境配置到CI/CD集成,含GitHub Actions模板
  • 别再只用passwd了!手把手教你用PAM的pam_pwquality.so模块给CentOS 7服务器上密码强度保险
  • Illustrator智能对象替换技术方案:5大匹配引擎驱动的设计自动化革命
  • 紧急预警:MCP 2026强制调度协议将于2025年Q2生效!你还在用静态配额?这6种智能分配误用正导致平均资源浪费率达41.3%
  • 刚开放!TikTok小游戏,能复刻国内小游戏的“暴富神话”吗?
  • 保姆级解读:从DiT论文到Sora,OpenAI的Scaling Law是如何炼成的?
  • Arm GIC-600中断控制器架构与低功耗设计解析
  • Fluent仿真自动化避坑指南:Workbench参数化设置中的5个常见错误与解决