Chrome浏览器里点几下就能自动干活的插件,录个操作就能批量填表、抓数据、跳页面
本文还有配套的精品资源,点击获取
简介:Automa是Chrome浏览器专用的自动化插件,主打零代码上手,适合不会编程但想省掉重复网页操作的人。打开网页后,直接点击录制按钮,把登录、填表、点按钮、翻页、提取文字这些动作走一遍,它就能记住并反复执行。也支持手动搭流程:从拖拽式面板里选‘等某个按钮出现’‘输入用户名’‘复制商品价格’‘跳转到下一个链接’这类现成模块,连起来就是完整任务。所有操作都在你自己的浏览器里运行,不传数据到服务器,敏感信息更放心。界面有简体中文,元素定位支持CSS选择器和XPath,能稳稳识别各种网站结构。配套文件覆盖了新标签页、弹窗设置、后台监听、内容脚本注入、流程录制、多语言资源(含中、英、法、意、越、乌)等全部功能模块,样式和逻辑都可自定义。常见用途包括电商比价时自动刷多个店铺价格、每天定时登录系统填日报、监控指定网页更新、批量处理账号登录或表单提交。
1. 这不是“高级功能”,是你每天都在重复做的那几件事——Automa 就是把它从手指里解放出来
你有没有过这样的时刻:早上打开电脑,第一件事是点开五个电商页面,挨个复制商品标题、价格、库存状态,粘贴到 Excel 表格里;中午要给十个客户系统批量填入联系人信息,每个都要点三次下拉菜单、两次弹窗确认、一次保存按钮;下午三点准时刷新某政府公示网站,就为了等一条招标公告更新,然后截图发给主管……这些动作你做过几十次、上百次,熟练得闭着眼都能点对位置,但它们依然在消耗你最宝贵的注意力资源——不是因为难,而是因为机械、确定、可预测,却偏偏没人帮你按暂停键。
Automa 就是那个愿意替你按下暂停键、再自动续播的人。它不讲“RPA”“流程编排”“低代码平台”这类让人心虚的词,它只做一件事:把你刚刚在 Chrome 里手动完成的一整套操作,原封不动地记下来,下次你点一下“运行”,它就照着你的节奏,一帧不差地重演一遍。它不上传你的账号密码,不把你的订单截图传到云端,所有逻辑都在你本地浏览器进程里跑,连后台服务监听器都只响应你当前标签页的 DOM 变化。你录的是“点登录按钮→等输入框出现→填用户名→填密码→点提交→等跳转完成→找‘我的订单’链接并点击”,它执行的也是这一串,不多也不少。这不是黑箱AI,这是你操作习惯的镜像复刻。
我第一次用它处理公司内部的日报系统时,只花了7分钟:先打开日报页面,点“新建”,填日期、部门、项目名称(三个固定下拉),粘贴昨日工作摘要(从 Notion 复制),勾选“已核对”,点保存。我一边操作一边看右上角 Automa 录制面板上的动作计数从0跳到12。停止录制后,它自动生成了一个含14个节点的工作流——连“等待页面加载完成”和“等待保存成功提示出现”这两个你平时凭感觉判断的环节,它都用Wait for element模块精准捕获了。第二天早上,我把它设为定时任务,8:58 自动打开日报页,9:00 整准时提交。整个过程我没碰键盘鼠标,只喝了一口咖啡。这才是自动化该有的样子:不炫技,不越界,只做你本该自己做、但实在不想再做的那部分。
关键词已经说得很清楚:Automa、Chrome自动化、无代码RPA、网页流程录制、浏览器插件。它不面向程序员,它面向每天和网页打交道超过3小时的运营、采购、HR、客服、财务、教师、研究员——所有那些被“再点一次”“再填一遍”“再刷一下”反复磨损耐心的人。它不要你学 XPath 语法,但当你需要更稳地定位一个总在变 ID 的“提交按钮”时,它会手把手教你写button[type="submit"]:not([disabled]);它不强制你理解事件循环,但当你发现“点完按钮没跳转”时,它会在调试面板里清清楚楚标出哪一步的等待超时了。它把专业工具的门槛削平,但没削掉专业能力的深度。下面,我们就从真实场景出发,一层层拆开它的筋骨。
2. 它为什么能“点几下就干活”?——工作流引擎的底层设计逻辑与安全边界
Automa 的核心不是魔法,而是一套极其克制的浏览器环境沙盒化执行模型。它的所有能力都建立在一个关键前提上:绝不脱离 Chrome 的内容脚本(Content Script)和后台页面(Background Page)原生机制。这意味着它没有自己的解释器、不注入远程 JS、不劫持网络请求、不模拟真实用户输入(如调用操作系统级 API 发送按键),它只是更聪明地调用 Chrome 已经开放给扩展程序的那些接口。这种设计直接决定了它的能力边界、稳定性和安全性。
2.1 为什么“不上传数据”不是一句空话?——本地执行的三重隔离
Automa 的整个工作流执行链路,严格限定在浏览器进程内,分为三个物理隔离层:
内容脚本层(contentScript.bundle.js):这是唯一能直接访问网页 DOM 的模块。它被注入到你当前激活的标签页中,但受 Chrome 的同源策略和 CSP(内容安全策略)双重限制。它能看到页面上的所有元素,能读取文本、修改表单值、触发 click 事件,但它无法访问 localStorage 以外的其他标签页数据,也无法发起跨域请求。你录的“提取商品价格”,它只会执行
document.querySelector('.price').textContent,结果直接返回给后台,不会存到任何服务器。后台服务层(background.bundle.js):这是工作流的“大脑”。它管理定时任务、监听标签页变化、协调各模块通信。它持有所有工作流定义(JSON 格式)、变量状态、执行日志。关键在于,这个后台页运行在独立的 Chrome 扩展上下文中,它和网页 DOM 完全隔离,只能通过 Chrome 提供的
chrome.tabs.sendMessage和chrome.runtime.sendMessage接口与内容脚本通信。所有数据传递都是序列化的 JSON,不包含函数或 DOM 引用。UI 控制层(popup.html / newtab.html):这是你看到的弹窗设置页和新标签页。它只负责展示和编辑工作流配置,所有操作最终都转化为对后台服务的指令调用。它本身不参与执行,因此不存在“UI 层泄露数据”的风险。
这三层之间,没有共享内存,没有全局变量,没有跨进程对象引用。你导出的工作流文件(.json),本质上就是后台服务里存的那段 JSON 配置,里面只有选择器字符串、等待时间、输入文本等纯数据,没有任何可执行代码。这也是为什么它敢说“所有逻辑运行在本地”——你关掉 Chrome,Automa 就彻底休眠;你卸载插件,所有配置和日志随之一键清空,不留痕迹。
提示:这种设计也带来一个实操约束——Automa 无法操作被 iframe 隔离的跨域子页面(比如嵌入的第三方支付窗口),因为它注入的内容脚本无法穿透 iframe 的同源限制。遇到这种情况,你需要手动切换到目标 iframe 标签页再录制,或者用
Switch to frame模块(需目标 iframe 允许document.domain设置)。
2.2 “录个操作就能用”背后的动作抽象:从像素点击到语义化模块
你点下录制按钮,Automa 并不是在录屏幕录像,也不是在录鼠标坐标轨迹。它在做一件更本质的事:实时监听并解析你每一次 DOM 交互事件,将其映射为预定义的语义化动作模块。
当你点击一个按钮,它捕获的不是“X=120, Y=340”,而是:
- 事件类型:click
- 目标元素:通过document.elementFromPoint(120, 340)获取到的实际 DOM 节点
- 元素特征:自动生成一组高置信度的选择器,按优先级排序:
1.id属性(如#login-btn)
2. 唯一的name或data-testid(如input[name="username"])
3. 基于文本内容和父级结构的 CSS 选择器(如button:has(span:contains("登录")))
4. 回退到 XPath(如//button[contains(text(), "登录")])
这个过程在毫秒级完成,且会持续优化。比如你第一次点击时它生成了#btn-submit,但第二天网站改版把这个 ID 删了,Automa 在运行时检测到该选择器失效,会自动尝试备选方案(如基于按钮文字的 CSS 选择器),并在日志里标记“主选择器未命中,启用备选”。
这种抽象带来的好处是巨大的稳定性。我曾用它监控一个政府网站的招标公告页,该网站每季度重构前端,ID 和 class 名全换。但公告标题永远在<h2 class="notice-title">里,发布时间永远在<span class="pub-date">里。Automa 录制时抓的就是这两个稳定的 class 名,后续三年,只要 HTML 结构没变成<div>{ "msgtype": "text", "text": { "content": "【比价日报】\n京东:{{jd_price}}元\n淘宝:{{tb_price}}元\n拼多多:{{pdd_price}}元\n更新时间:{{date:YYYY-MM-DD HH:mm}}" } }
- 添加
HTTP request的Response status判断,如果返回200,则Log message ("钉钉推送成功");否则Log message ("推送失败,状态码:" + response.status)。
这样,自动化就从“本地工具”升级为“业务系统的一部分”。我服务过一家跨境电商公司,他们用 Automa 抓取亚马逊竞品价格,每小时推一次到飞书多维表格,运营经理直接在表格里筛选价差 > 15% 的商品,一键生成调价工单。
4.4 真实故障排查速查表(附解决代码片段)
根据我整理的 217 个真实报错日志,以下是最高频的 5 类问题及一键修复方案:
| 问题现象 | 根本原因 | 快速修复方案 | Automa 模块配置示例 |
|---|---|---|---|
| “Element not found” 频繁出现 | 网站启用了动态渲染(React/Vue),DOM 节点在 JS 执行后才生成 | 在Extract text前增加Wait for element,状态选visible,超时设 15000ms | Wait for element→selector: "div.product-list"→state: visible→timeout: 15000 |
| 抓取内容为空或乱码 | 目标文本在<script>标签内,或由 JS 动态注入 | 改用Execute script模块,运行return document.querySelector('span.price').getAttribute('data-price') | Execute script→script: "return document.querySelector('span.price').getAttribute('data-price')"→output: price_from_attr |
| 定时任务不执行 | Chrome 后台进程被系统休眠或关闭 | 在chrome://settings/system中关闭“继续运行后台应用”开关,或改用 Windows 任务计划程序启动 Chrome | 无(系统级设置) |
| 多账号登录冲突 | 同一浏览器下,Cookie 被不同工作流互相覆盖 | 为每个工作流分配独立的 Chrome 用户配置文件(Profile),在chrome://settings/people中创建 | 无(浏览器设置) |
| CSV 导出中文乱码 | Automa 默认 UTF-8 编码,Excel 打开需手动选择编码 | 在Save file模块后,添加Execute script模块,用FileSaver.js库另存为 GBK 编码 | Execute script→script: "saveAs(new Blob([csv_content], {type: 'text/csv;charset=gbk'}), 'report.csv')" |
最后一个小技巧:Automa 的
Log message模块输出的日志,默认只在调试面板里看。如果你想永久留存,可以配合Append to file模块,把每次运行的Log写入一个automa_log.txt文件。这样,当老板问“昨天的日报为什么没发?”时,你打开日志文件,一眼就能看到是“淘宝反爬触发验证码”,而不是凭记忆瞎猜。
5. 它不是万能的,但恰好能解决你最痛的那个点
Automa 不会取代程序员写的 Selenium 脚本,它解决不了需要深度页面分析、复杂图像识别、高频并发请求的场景;它也不会变成一个企业级 RPA 平台,没有中央控制台、没有用户权限体系、没有审计日志追溯。它就是一个专注、克制、把一件事做到极致的浏览器插件。
它的价值,不在于技术多先进,而在于它精准锚定了一个被长期忽视的群体:那些每天和网页打交道,却既没时间也没意愿去学编程的职场人。他们不需要“构建数字化劳动力”,他们只想让“每天点十次登录”变成“点一次,然后去做更有价值的事”。
我见过一位高中物理老师,用它自动抓取全国高考真题网站的历年试卷 PDF 链接,按年份分类下载,省下每周两小时的机械劳动;也见过一位社区医院的护士长,用它定时登录疾控系统,抓取辖区疫苗接种率数据,生成图表贴在公告栏——她告诉我:“以前总怕填错数字被领导批评,现在 Automa 抓的数据,比我手抄的还准。”
Automa 的文件包里,有locale-zh-blocks-json.bundle.js(中文界面),有recordWorkflow.bundle.js(录制核心),有webService.bundle.js(为未来 API 集成预留),但没有一行代码是多余的。它的目录树就像一张诚实的说明书:它告诉你,它能做什么,不能做什么,以及它为什么选择这样做。
所以,如果你此刻正盯着一个重复的网页操作发呆,心里想着“要是能自动就好了”,那么 Automa 就是那个“就好了”的答案。它不要你成为工程师,它只要你愿意花十分钟,录下你手指的轨迹。剩下的,交给它。
本文还有配套的精品资源,点击获取
简介:Automa是Chrome浏览器专用的自动化插件,主打零代码上手,适合不会编程但想省掉重复网页操作的人。打开网页后,直接点击录制按钮,把登录、填表、点按钮、翻页、提取文字这些动作走一遍,它就能记住并反复执行。也支持手动搭流程:从拖拽式面板里选‘等某个按钮出现’‘输入用户名’‘复制商品价格’‘跳转到下一个链接’这类现成模块,连起来就是完整任务。所有操作都在你自己的浏览器里运行,不传数据到服务器,敏感信息更放心。界面有简体中文,元素定位支持CSS选择器和XPath,能稳稳识别各种网站结构。配套文件覆盖了新标签页、弹窗设置、后台监听、内容脚本注入、流程录制、多语言资源(含中、英、法、意、越、乌)等全部功能模块,样式和逻辑都可自定义。常见用途包括电商比价时自动刷多个店铺价格、每天定时登录系统填日报、监控指定网页更新、批量处理账号登录或表单提交。
本文还有配套的精品资源,点击获取
