当前位置：首页 > news >正文

跨境电商商品采集skill来了，可部署openclaw，不用Python也能搞定爬虫

news 2026/6/14 10:58:00

最近openclaw养龙虾的热潮带动了skill的爆发，github上各种skill层出不穷，可以解决繁杂的办公自动化任务，比如生成ppt、运营媒体账号、审查代码等，skill已经成为ai时代的“万能软件”。

刚好有个朋友是做跨境3D打印业务，平时需要分析相关3D打印商品价格趋势，我帮他写个可以用于采集跨境电商商品的skill，部署在openclaw里，能通过钉钉对话输入商品关键词，自动采集对应的商品信息，完全不需要再写任何代码。

最终实现的核心功能有2个：

1、输入关键词获取商品信息

2、ai自动分析商品，返回分析报告

这个skill的核心是amazon商品采集功能，我是通过亮数据的Scraper APIs实现的，通过python requests进行访问，能实现无障碍的商品信息采集。

这里简单介绍下亮数据的Scraper APIs，它把amazon等网站平台采集功能封装到一个接口了，且内置了ip代理池、验证码解锁器、动态网页解析等爬虫技术，不需要再通过代码脚本去处理，基本可以实现一键采集。

创建这个skill还需要两个工具，一个是trae或者vscode编辑器，另一个是Anthropic发布的用于创建skill的skill，名字叫作skill-creator，你可以在github中找到它。

接下来是详细的实现步骤。

登录亮数据，获取key

因为亮数据需要key才能请求数据，所以第一步先登陆获取key

https://get.brightdata.com/w3h8e

找到Web Scrapers Library，获取API

亮数据后台有专门的采集库，需要找到amazon平台的api，获取Python采集代码。

这次skill是根据关键词来搜索商品，所以选择对应的api，复制保存该python采集代码，后续会用到。

因为亮数据采集的数据会保存在云服务快照中（临时存储），每次采集后还需要下载快照中的数据集（csv或者json格式），也需要复制保存该下载代码。

配置Trae和skill-creator技能

Trae是代码编辑器，安装配置都很简单，这里不多说了。

skill-creator是专门用来创建skill的技能，推荐使用Anthropic发布的，更加可靠好用。

可以从github下载该skill压缩包，然后配置到Trae中。

创建amazon-product-scraper技能

做好准备工作后，开始创建用于采集amazon商品的skill，在Trae中新建文件夹，放入之前亮数据中复制的代码，采集脚本为scraper.py，下载脚本为dowload.py。

在ai对话框中输入创建skill的指令，如下：

利用skill creator创建一个skill，用于采集亚马逊的商品数据，可以让用户直接通过关键词搜索商品，并整理成结构化的md文档或csv表格。文件中有两个脚本供参考， scraper.py 负责请求下载数据， dowload.py 负责下载快照的数据集。
❞

这样ai会自动调用skill-creator技能，来创建新的skill。

创建好skill后，便会看到一个新建的amazon-product-scraper文件夹，里面有个SKILL.md文件，这便是新的技能。

将skill配置到openclaw中

创建好amazon-product-scraper skill后，再配置到openclaw中，首先你得自己的小龙虾，然后将SKILL.md文件扔给它，并让它创建skill。

openclaw会自动部署该skill，并让你配置亮数据的API key。

接下来，就是见证奇迹的时刻，我们输入命令，让它“搜索amazon中3d printer相关的商品”。

openclaw会调用skill采集amazon上3D打印相关的商品数据，并返回csv和md格式文件。

数据集如下，商品相关字段有60多个，比如商品名称、价格、销量、url等等，非常详细。

这样就搭建好了一个完整的跨境电商商品采集skill，且通过openclaw能自动化运行，想搜索什么商品就能快速得到数据集。

这里用到的核心功能是亮数据的采集接口，能直接采集的一些平台的数据集，不需要配置复杂的爬虫代码，大大简化了网页数据采集复杂度。

https://get.brightdata.com/w3h8e

当然这种仅限于自己玩玩，需要合法合规，不能用于商用。

查看全文

http://www.jsqmd.com/news/647598/

为什么Redis的KEYS命令在生产环境是禁止使用的？

运维工程师最后的护城河正在崩塌？：多模态大模型自动解析监控截图、语音工单、异常堆栈的3层可信推理机制

网络运维Windows Server管理

计算机毕业设计：Python全国降水数据采集与预警平台 Flask框架数据分析可视化大数据 AI 大模型爬虫数据大屏（建议收藏）✅

便携式综合气象观测仪

NLP学习笔记03：文本分类——从 TF-IDF 到 BERT

嵌入式学习day3：数组与结构体

【独家首发】央企信创云实战：基于Qwen-VL与InternVL的多模态运维Agent（已通过等保2.0三级认证）

CodeQ 项目数据库设计

数学建模研究者可通过爱毕业(aibiye)快速实现论文复现与自动化排版

amcl_pose vs tf的位姿输出频率

SpringBoot入门核心要点

零知识证明系统：zk-SNARK协议的工作原理与构造

基于MPC模型预测控制的风电与储能调频策略：实时调整风电出力，仿真对比展现优越性

负载因子才0.5，unordered_map就有30%的桶在碰撞——读libstdc++源码看懂Google为什么要造absl::flat_hash_map

Web 品质可读性

Spring Data 2027 高级查询技巧：构建高效的数据访问层

构建垂直领域专家级AI Agent的方法论

Windows系统iPhone USB网络共享驱动终极安装与优化指南

SMRT借助AI与数据分析技术预测轨道故障并提升维护效率

从阻容复位到专用芯片：以MAX706为例，解析MCU看门狗复位电路的设计升级

C语言完美演绎8-3

Linux 安全加固：从攻击链反推，把每道门都锁上

Redis 慢查询优化与内存分配调优

突发大洗牌！Claude强制“刷脸+护照”实名，GPT与Gemini全面封杀进入倒计时？

金三银四上云季：阿里云服务器选购终极指南（附内部85折扣通道）

【架构分享】多浏览器并发 RPA 中的状态同步与会话持久化：构建高可用电商运营流水线

VN1640A硬件实战：深入CANoe采样点(Sample Point)与位时序(BTL Cycles)配置原理

ncmdumpGUI：三步搞定网易云音乐NCM格式转换的完整解决方案

登录亮数据，获取key

找到Web Scrapers Library，获取API

配置Trae和skill-creator技能

创建amazon-product-scraper技能

将skill配置到openclaw中

相关文章：