浏览器操控双雄对决:Claude Code bb‑browser 与 agent‑browser 完全指南
AI Agent 能力再强,被锁在命令行(CLI)里也不过是困兽之斗。上周让 Claude Code 帮我冲 618 红包雨,就是因为它能直接点屏幕上的“开红包”,替我薅了上百块羊毛。给 AI 一双能“动手”的“眼睛”,是它能突破信息获取、闯入执行层的关键一步。
目前市面上已有 13 个同类项目,bb‑browser 与 agent‑browser 是最有代表性的两匹“黑马”。它们都能让 AI “亲手”操作网页,但在定位、原理、效果以及最终的实战感受上差异显著。本文将全面剖析两个工具,从安装、上手到 Clabude Code 实战,帮你一步到位了解全貌。
一、它们在解决什么问题?
AI Agent 要操作网页(如爬数据、填表单、做自动化测试),传统方式是找目标网站要 API 接口(通常昂贵或不存在),或用 Playwright 这类自动化框架写复杂脚本。前者对许多网站不现实,后者需要大量的手动调试与维护工作。
bb‑browser 和 agent‑browser 提供了一套标准化的“AI 级 API”,将浏览器视作一个 Agent 可直接调用的黑箱。Claude Code 不再需要理解 HTML、CSS,只需通过简单的命令行就能完成点击、填表、截图等操作,真正“控制”起浏览器。
二、bb‑browser:基于真实浏览器会话的“互联网入口”
一句话定位:
bb‑browser 是一个 CLI 工具 + MCP 服
