两栖模式Agent--AmphiLoop,给OpenClaw“龙虾”来个降维打击?
最近在GitHub上瞎逛,发现了一个很有意思的开源项目——AmphiLoop。
一开始以为只是个普通的Agent框架,但仔细看完文档和源码之后,我承认:我被震撼到了。它提出了一套完全不同于OpenClaw(龙虾)、Hermes Agent的智能体构建思路,甚至可以说是在解决一个龙虾们至今都没能很好回答的问题:
如何既拥有AI的自主性,又保持企业级应用需要的稳定、可控和低成本?
这个项目给出了一个相当优雅的答案——两栖模式(Amphibious Mode)。
先放地址,感兴趣的直接去研究:https://github.com/bitsky-tech/AmphiLoop/
一、“龙虾”很火,但企业用起来真的香吗?
坦白说,我也是OpenClaw的用户。那种用自然语言指挥电脑干活的感觉,确实爽——整理文件、批量回复邮件、跨系统搬运数据……人只需要动动嘴,AI就把脏活累活干了。
但当我真正想把它用到工作中、跑一些长周期的自动化任务时,问题就暴露了:
- 稳定性:一个5步的任务,每一步成功率90%,整体成功率只剩59%。稍微复杂一点,它就开始“发疯”。
- 成本:token消耗像喝水一样,企业级场景根本扛不住。
- 安全性:你永远不知道它下一步会不会执行什么危险操作。
项目作者在文档里说了一句话,我特别认同:
“AI技术落地难的主要原因,并非它的准确率还不够高,而是我们使用这种独特能力的方式不对。”
那什么才是“对的方式”?AmphiLoop给了答案。
二、核心洞察:workflow和agent,各司其职
AmphiLoop提出了一个很基础、但被很多人忽略的分类法:
根据“目标和路径是否明确”,任务可以分为:
- 确定性任务:目标和路径都明确(如“登录签到”)
- 路径不明确的任务(如下棋)
- 目标大致明确的任务(如“写一份报告”)
- 混合型任务
而执行模式也有两种:
- workflow模式:确定性代码,不依赖LLM,稳定、零token
- agent模式:自主规划执行,灵活但成本高、不稳定
关键问题来了:很多人在用龙虾时,把第1类确定性任务也扔给agent模式去干——这是典型的“杀鸡用牛刀”,不仅贵,还不稳定。
正确的做法应该是:
- 确定性任务 → workflow模式(稳定、省token)
- 不确定的任务 → agent模式(灵活、自主)
AmphiLoop的核心价值就在于此:它不是一个单纯的Agent,而是一套方法论+工具链,帮你自动把自然语言描述的任务,转化成“workflow+agent”混合执行的代码,并且能够在运行时根据环境变化自动切换模式。
三、AmphiLoop到底是什么?
“AmphiLoop,全称Amphibious Loop(两栖循环),是一套全新的AI智能体构建方法论、技术栈和工具链。”
我自己的理解是:
它是一个Claude Code插件,通过一套“探路 → 编码 → 验证”的流程,让你用自然语言(TASK.md)描述任务需求,然后自动生成可重复执行的自动化代码。
生成的代码有两种形态:
- Workflow模式:纯确定性执行,零token消耗,适合稳定场景
- Amphiflow模式:workflow+agent两栖,遇到环境变化(如页面改版、登录过期)自动切换到agent模式处理,处理完再切回workflow
这也是它名字的由来——两栖循环。
四、我是怎么上手的?
说实话,这个项目的体验设计做得相当友好。我用的是浏览器自动化场景(项目在这方面做了专门优化)。
第一步:安装
在Claude Code里执行:
/plugin install https://github.com/bitsky-tech/AmphiLoop或者直接敲/build-browser,系统会自动引导。
第二步:创建TASK.md
这是唯一需要我动手写的地方。用自然语言描述任务就行,比如:
## Task Description 1. 打开电商网站 2. 搜索“机械键盘” 3. 按销量排序,提取前10个商品的名称和价格 4. 保存到 orders.json ## Expected Output 生成 orders.json 文件,包含10条商品记录,每条有 name 和 price 字段 ## Notes 如果登录过期,提示我重新登录第三步:自动构建
执行/build-browser后,系统会自动:
- 探路:先探索一下页面结构、CLI工具调用顺序,生成
exploration_report.md - 编码:根据我的选择和任务描述,生成workflow或amphiflow代码
- 验证:自动运行测试,检查是否符合Expected Output,不符合就自动修复
整个过程基本不需要我干预,一个对话session就搞定了。
第四步:重复执行
构建完成后,用uv run就能稳定执行。最让我吃惊的是:一个原本需要反复调LLM的任务,生成后运行时token消耗为0(如果是纯workflow模式)。
五、最惊艳的功能:两栖模式自动切换
AmphiLoop最让我拍大腿的设计是Amphiflow模式。
假设我构建了一个浏览器自动化程序,每天定时去某个后台抓数据。正常情况下,workflow模式稳定运行,token消耗为0。
突然有一天,登录态过期了,程序报错。
如果是普通workflow,直接崩溃退出。但amphiflow会怎么做?
它自动切换到agent模式,模型“看到”自己被弹到了登录页,推理出需要重新认证,然后发起一个human-in-the-loop请求让我扫码登录。我登录完成后,它自动切回workflow模式,继续执行后续任务。
整个过程行云流水,我只需要做一次登录操作。
项目文档里有一句话我特别喜欢:
“善用自主性,隔离随机性,获得确定性。”
AmphiLoop把AI的自主性用在了最该用的地方——处理意外,而不是无脑地用在每一步上。
六、和OpenClaw/Hermes有什么不同?
维度 | OpenClaw / Hermes | AmphiLoop |
执行模式 | 纯agent模式 | workflow + agent 两栖切换 |
Token消耗 | 每一步都消耗 | 确定性部分零token |
稳定性 | 错误累积效应明显 | workflow部分100%确定 |
适用场景 | 创意、生成式、一次性任务 | 长程、重复执行、混合型任务 |
可维护性 | 对话即用即弃 | TASK.md可版本管理、迭代 |
环境变化应对 | 每次都重新规划 | workflow兜底,agent处理异常 |
不是说龙虾不好,而是场景不同。龙虾适合那种“临时起意”的任务,而AmphiLoop适合企业级、长周期、需要稳定执行的自动化场景。
七、一点思考
我试用下来,AmphiLoop这套“先探路、再编码、后验证”的思路,本质上是在为AI的不确定性加上一层确定性外壳。
它没有试图让LLM变得更准(这不可能),而是通过方法论和架构设计,把不确定性隔离到最小范围。该用模型的地方用模型(处理意外、理解语义),不该用的地方坚决不用(确定性流程)。
这种思路,我觉得比单纯堆模型参数、拼准确率要务实得多。
项目目前已经在GitHub开源,感兴趣的可以去看看:https://github.com/bitsky-tech/AmphiLoop/
另外,他们还配套了一个浏览器工具库bridgic-browser,适合那种即时性的自动化操作,安装命令:
/plugin install https://github.com/bitsky-tech/bridgic-browser-skill最后引用项目文档里的一句话作为结尾:
“只要颗粒度拆到足够细,技术是流程,思维也是流程。将流程进行自动化的诉求是普遍存在的,这是一个极其广阔的世界。”
学习资源推荐
如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。
一、全套AGI大模型学习路线
AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!
因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取
二、640套AI大模型报告合集
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示
因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取
三、AI大模型经典PDF籍
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。
因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取
四、AI大模型商业化落地方案
作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。
