火语言 RPA:元宝 AI 来源参考网址采集案例(GEO 优化)
一、案例说明
本案例通过火语言 RPA 模拟向元宝 AI 提问,并自动抓取 AI 回答下方的来源参考网址,用于分析哪些网站更容易被 AI 引用,为 GEO(生成式引擎优化)提供数据支撑,指导内容布局与站点优化。
二、案例逻辑
整个流程逻辑:启动流程 → 打开元宝 AI 网页端 → 读取预设问题列表 → 循环提交单个问题 → 等待 AI 生成回答 → 定位并提取回答中的来源参考网址 → 循环执行多轮提问与采集 → 网址保存到本地。
三、操作细则
1、列表打开或新建,新建空表格,用于存储列表数据
2、打开浏览器,打开本地浏览器,指定固定 Chrome 路径,避免调用系统默认浏览器导致环境不一致
附加参数:--profile-directory="Profile 1",本地如果有多个Chrome用户,配置附加参数,指定启动 Chrome 的特定用户配置文件,这里设置的是默认用户,如没有多个用户,可不用配置。(https://www.huoyuyan.com/community/detail.html?id=336)
3、浏览网页,输入网址URL:https://yuanbao.tencent.com/chat/naQivTmsDa?yb_channel=3003
这里需优先在网页登陆元宝账户,点击联网搜索。
4、文件读取,批量读取待提问的关键词,为后续循环提问提供数据源
要读取的文件:本地文件路径
文件读取方式:文件内容列表(按行读取文本内容)
5、ForEach循环,循环进行提问抓取来源网址
5.1、鼠标/元素点击,定位元宝 AI 网页的提问输入框
选定元素:#search-bar > div > div > p
5.2、模拟键盘输入,输入当前处理的问题内容
输入内容:item
5.3、鼠标/元素点击,定位元宝AI网页的发送/提问按钮
目标元素:#yuanbao-send-btn
5.4、等待元素显示消失,等待AI 回答完成,来源参考区域的标识元素出现。
目标元素:(//span[@class='ToolbarSearchGuid_source__XMsID'])[last()]
等待内容:元素显示
5.5、睡眠等待,等待指定时间,确保 AI 完成回答后再执行后续操作
5.6、鼠标/元素点击,点击来源参考区域
目标元素:(//span[@class='ToolbarSearchGuid_source__XMsID'])[last()]
5.7、睡眠等待,等待指定时间,等待引用来源显示
5.8、获取多元素信息/属性值,获取引用来源的网址
目标元素://div[@class="hyc-common-markdown__ref_card"]
每个元素节点:指定属性值
属性名称:data-url
输出变量:网址URL
5.9、打印日志,可选,打印上一步的调试日志,以便调试诊断
5.10、列表合并,将网址URL合并到List1列表中
5.11、睡眠等待,等待执行时间执行下一次循环
6、Excel打开文档,打开指定Excel文档,用于存储List1的网址数据
7、Excel写入内容,写入List1数据
四、划重点
1、浏览器启动需指定本地 Chrome 的绝对路径,确保环境一致性;
2、需提前自建关键词.txt(按行存问题)和指定 Excel 文件(存 URL 列表),且文件路径配置要准确。
案例分享:
https://www.huoyuyan.com/market/application_detail.html?key=cd632082bfc84a848549617894eeffa6
