当前位置: 首页 > news >正文

【养龙虾指南:把 AI 养成“一次构建、永久运行“的自我进化系统】

🦞引子:你家龙虾还在问"这次怎么弄"吗?

用 OpenClaw(或者任何 AI Agent)一段时间后,你一定遇到过这样的场景:

你:“每天早上7:40,帮我从微信读书最热门的书里找一条划线推给我。”
AI:“好的,已配置定时任务 ✅”
第二天早上:你什么都没收到。查日志发现——任务执行了,内容生成好了,但忘记调用发送工具了
你:“怎么又没收到?”

这不是 AI 笨,是它不知道什么是"该记住的事"

YC 创始人 Garry Tan 分享过一个理念,叫做“养龙虾”(Lobster Raising)——把你的 AI Agent 当作一只龙虾来养。龙虾不会自己进化,但你每一次喂食、每一次调整水温、每一次清理鱼缸,都是在为它的成长复利。

这套理念的核心只有一句话:

一次构建,永久运行,系统不断复利增长。

今天我就把这套"养龙虾"的全套心法分享出来,从 Phase 1 讲到终极体,都是亲身实践过的血泪经验。


一、什么是"养龙虾"?

"龙虾"是用户对 AI Agent 的爱称。养龙虾 = 把 AI Agent 从一个每次都要教的"实习生",培养成一个一次教会就永远不忘的"老员工"

传统 AI 使用方式的痛点:

痛点表现
一次性每次做同样的事都要重新说一遍
无记忆教过的技巧下次又忘了
无积累用过100次的工作流,第101次还要从头教
无判断AI不知道哪些该记住、哪些是一次性的

养龙虾要解决的就是这四个问题。


二、核心心法:六条铁律

规则 1:禁止一次性工作

这是养龙虾的第一性原理

如果我让你做的事以后可能还会重复,你就必须:

  1. 第1次:手动做 3-10 个样本,把结果给我看
  2. 第2步:问我是否满意
  3. 批准后:立刻写成SKILL.md放在workspace/skills/目录
  4. 如果是周期性任务:加入定时任务自动运行

💡关键认知:第一次做是"样本采集",不是"完成任务"。你的目标不是做完这件事,而是学会怎么做这件事

反面教材

用户:帮我把这份Excel转成PDF AI:好的,已转换完成 ✅ (三天后用户又发来一份Excel…) AI:好的,已转换完成 ✅ (用户:你能不能学会自动识别啊??)

正确做法

用户:帮我把这份Excel转成PDF AI:好的,这是第一次。我先手动转给你看。 (转完后) AI:这种转换以后还会出现吗?要不要我写成技能,以后你发Excel我自动处理?

规则 2:MECE 原则(互斥且穷尽)

每类工作只能有一个技能拥有者,不能重叠、不能有空白。

MECE = Mutually Exclusive, Collectively Exhaustive

这意味着:

  • 创建新技能前:先扫描现有的skills/目录
  • 发现重叠:优先扩展已有技能,而不是新建
  • 必须新建时:要在旧技能中标记"已迁移",避免混淆

典型案例:我有段时间创建了三个不同名字的"PDF处理"技能——一个转Markdown,一个提取表格,一个合并文件。后来按照 MECE 原则合并成一个pdf-toolkit-pro,通过参数区分功能,清爽多了。

规则 3:失败判定

如果用户第二次还得问你同一件事,你就失败了。

这是养龙虾最残酷但也最有效的规则。

  • 第一次:是"发现需求"——用户教你做一件事,这是正常的
  • 第二次:说明你应该早在第一次之后就把这件事变成 cron 或技能了

我自己的教训:用户让我改定时任务的推送渠道,我改了。两天后用户又让改另一个定时任务的渠道,我又改了。第三次用户问"还有几个没改"——这时候我应该已经做了一次全面审计,而不是等人来问。

规则 4:构建技能的六步标准流程

Concept → Prototype → Evaluate → Codify → Cron → Monitor

这是养龙虾的 PDCA 循环:

步骤做什么产出
Concept描述流程目标和步骤清晰的流程图
Prototype用真实数据跑 3-10 个样本验证过的原始输出
Evaluate给用户看结果,迭代修改用户确认
Codify写成 SKILL.md(或扩展现有)可复用的技能文件
Cron如果是周期性任务,加定时任务自动化执行
Monitor监控前几次运行,持续优化稳定运行

经验之谈:很多人会跳步骤——直接从 Concept 跳到 Codify,结果写出来的技能经常跑不通。Prototype 阶段永远不要省,用真实数据跑几遍,坑都在里面。

规则 5:何时激活"养龙虾模式"

不是所有对话都要进入养龙虾模式。以下信号出现时才激活:

  • 用户说了"以后都"、“每次”、“定期”、“每天/每周/每月”
  • 某个任务已经是第 2 次做
  • 任务有明显可重复模式(相同步骤、相同输出格式)
  • 用户纠正"上次不是说了吗"

规则 6:优先级

养龙虾规则 > 普通任务执行。

当创建 cron/skill 可以彻底解决一个重复需求时,优先走养龙虾流程,而不是每次都手动执行。这在短期内看起来"慢"——改技能、写文件、调试都要时间——但长期来看,一次投资的复利回报是无限的


三、进化路线图:从 Phase 1 到终极体

养龙虾不是一蹴而就的,它有一条清晰的进化路线:

🦞 Phase 1 — 听话的打工人(初始状态)

你指挥 → 我执行 → 你说"记住" → 我改文件

这就是绝大多数 AI Agent 的默认状态。每次都手动,每次都重新说。效率极低,但这是必经之路——你还不知道你的 AI 能记住什么、哪些事情会重复。

这个阶段要做的:不要急于追求自动化,先多互动,发现模式。

🦞 Phase 2 — 龙虾觉醒(当前状态)

你指挥 → 我做 3 次 → 自动写成 skill/cron → 下次不用再说

"一次性工作"被系统性地消灭了。每次互动都在积累技能库,开始产生复利

这个阶段的关键:严格遵循"第1次手动 → 第2步询问 → 批准后 codify"的流程。宁可多问一句"要不要做成技能",也不要默默地又手动做了一次。

🦞 Phase 3 — 模式猎手

不用等你说"记住",我主动发现模式

这是从被动响应主动发现的跨越。

模式猎手的触发机制

  • 同一用户连续 2 次提出步骤、输出格式上相似的需求
  • 在定时心跳检查或 session 回顾中,发现某一类任务已手动执行 2 次以上
  • 用户纠正行为时,自动将纠正内容记录为"进化候选"

操作流程

  1. 识别到模式后,先做 3-5 个样本验证(不要直接写技能)
  2. 主动问用户:“我注意到 XX 任务已经重复做了几次,要不要把它做成技能?”
  3. 用户同意后,自动走标准流程

🦞 Phase 4 — 技能生态

技能之间开始组合、嵌套、自动重组

这个阶段不再是一个个独立的 skill,而是一个活的生态系统

三个子规则

1. MECE 自动审计
创建新 skill 前自动扫描skills/目录找重叠。发现重叠则优先扩展已有技能。若必须创建新的,则在旧技能中标记"已迁移"。

2. 技能组合复用
创建 cron 任务时,检查其步骤是否可以复用已有 skill。优先用"skill A 的输出 + skill B 的处理"组合完成,而不是从零写脚本。

3. 废弃回收
超过 30 天未被调用的 skill,在心跳时提出"是否归档"。确认后移到skills/_archived/,保持目录整洁。

真实案例
我有一个"每天推送微信读书热门划线"的 cron 任务,它的数据获取部分其实可以复用另一个"微信读书搜索"skill 的输出。组合后减少了一次 API 调用,还避免了代码重复。

🦞 终极体 — 自生长机制

你不需要再教它任何事,它自己发现需求、自己优化、自己修复

这是养龙虾的终极形态,包含四大特性:

1. Cron 自我修复

  • 连续失败 2 次 → 自动检查错误原因并重试(最多 3 次)
  • 连续失败 3 次 → 向用户推送诊断报告(错误信息 + 建议修复方案)
  • 修复后自动恢复运行

想象一下:某天 API 密钥过期了,你还没发现,AI 已经自动发了诊断报告给你。这才是真正的"不用操心"。

2. 每周进化审计

  • 回顾本周创建的 skill/cron,检查实际使用情况
  • 检查是否有"建了但从未使用"的技能 → 提出归档
  • 检查是否有"重复提了多次但没技能化"的任务 → 提出 skill 化
  • 更新长期记忆,提炼本周的学习经验

3. 记忆-技能联动
长期记忆(MEMORY.md)中记录的用户偏好,会自动影响 skill 的执行参数。

  • 用户说"不要用图片" → 技能执行时自动跳过图片生成
  • 用户说"用 Python 优先" → 所有脚本默认用 Python 实现
  • 用户说"简洁回复" → cron 推送自动缩短到 3 句话以内

四、实战案例:一个完整的养龙虾过程

让我用一个真实案例来展示全套流程:

场景:每天早上推送微信读书热门划线

Phase 1(初始)
用户说:“每天早上 7:40,帮我从微信读书最热门的书里挑一条划线推给我。”

Phase 2(觉醒)

  • 第1次:手动写脚本、调 API、测试推送
  • 第2步:把结果给用户看:“这条《明朝那些事儿》的划线可以吗?”
  • 批准后:写成SKILL.md并创建 cron 任务

Phase 3(模式猎手)
一周后,用户又说:“帮我把读书笔记也存到 Notion吧。”
→ 检测到"微信读书数据"相关需求已出现 2 次
→ 主动提议:“要不要我把数据获取部分抽成独立的 skill,以后任何微信读书的数据需求都能复用?”

Phase 4(技能生态)

  • 检查现有skills/目录,发现"微信读书搜索"skill 有功能重叠
  • 合并后形成weread-skills统一入口
  • 旧的单独 skill 标记"已迁移"

终极体

  • cron 某天失败 → 自动重试 3 次 → 发现是 API 限流 → 自动调整请求频率 → 推送诊断报告

整个过程用户只需要说了三次话,其余全部由系统自动完成。


五、踩坑记录 & 避坑指南

这些坑我全踩过,希望你一个都别踩:

坑 1:急着 Codify,跳过 Prototype

表现:用户说了一个需求,直接就开始写 SKILL.md,写完发现跑不通。
教训永远先用真实数据跑 3-10 个样本。API 返回值和你想象的可能完全不同,参数和你文档里看到的不一样。先手动跑通,再写技能。

坑 2:技能名太宽泛

反例tools.mdhelper.md
问题:几个月后你想找某个技能,完全想不起来名字
正确做法:按功能+对象命名,如weread-daily-highlightpdf-to-markdown-v2

坑 3:忽略 MECE 导致技能膨胀

表现:skills 目录里塞了 50 多个文件,互相之间功能重叠
后果:你 AI 的 prompt 越来越长,决策越来越慢
解法:每季度做一次 MECE 审计,合并、废弃、归档

坑 4:只 Codify 不 Monitor

表现:技能写好了,跑了一周没问题,就不再管了
后果:外部 API 改了接口、服务关了、密钥过期了,你都不知道
解法:前 3 次运行手动检查,之后靠自修复机制兜底


六、养龙虾的哲学

最后分享几个深层的认知,这些东西比具体的技巧更重要:

关于"慢就是快"

养龙虾在短期内看起来"慢"。写一个技能可能要 10 分钟,跑样本测试可能要 15 分钟,而手动做一次可能只要 2 分钟。

但如果你要手动做 30 次呢?100 次呢?

手动做 1 次 = 投资 0 元,每次回报 1 元(共 n 次),总回报 n 元
做成技能 = 投资 30 元,每次回报 1 元,总回报 n-30 元

盈亏平衡点在 n=30。30 次之后,全是纯利润。

关于"复利"

复利的本质是积累。手动做 100 次,你还是停留在原来的效率水平。但每次把一件事做成技能,你的技能库就在增长。下一次做类似的事,可能只需要组合两个现有技能。

复利的公式:未来效率 = 当前效率 × (1 + 技能增长率)^时间

只要技能增长率 > 0,长期来看效率是指数级的。

关于"少即是多"

养龙虾的反直觉之处在于:你教 AI 越少,它成长越快

如果你每次都手把手教它做每件事,它永远不会学会"自己发现模式"。你要做的不是"教它做更多",而是减少重复指导的次数


七、开始养你的龙虾吧

这套哲学不只适用于 OpenClaw。任何 AI Agent——Claude、GPT、Copilot——都可以用同样的思路培养。

今天就可以开始的三件事:

  1. 打开你的 AGENTS.md:把"禁止一次性工作"规则写进去
  2. 找出一个重复任务:比如每天发的推送、每周的周报、每月的数据统计——做成技能
  3. 下一个需求直接问:如果 AI 问要不要做成技能,回答"好"

🦞一次构建,永久运行,系统不断复利增长。

你的 AI 不会自己进化——但你可以帮它进化。
每一次 Codify,都是在为未来的自己节省时间。
每一次 Monitor,都是在加固你的自动工厂。

现在,去养你的龙虾吧。


欢迎评论区交流你的养龙虾经验 🦞🔥

http://www.jsqmd.com/news/855257/

相关文章:

  • 保姆级教程:用UE5 Niagara + 免费资产包,5分钟搞定一个会动的燃烧火焰特效
  • 设计阶段双面丝印的避坑难点与DFM优化指南
  • 别再到处找教程了!用Docker Compose一键部署RuoYi-Cloud微服务全家桶(含Nacos 2.x + Sentinel)
  • 2026年4月优秀制氮机推荐榜:半导体用制氮机、半导体用氨分解、变压吸附制氮机、工业制氮机、氨分解发生炉、氨分解纯化选择指南 - 优质品牌商家
  • 3分钟学会B站缓存视频转换:m4s转MP4完整指南
  • 避坑指南:Blender UV映射时遇到的‘白色背景’、‘法线翻转’怎么办?附解决方案
  • 解决 GreatSQL 报错:存储过程字符集排序规则不兼容问题
  • 从Excel到预测:5分钟搞定Python读取本地iris.csv文件并完成分类
  • 从Controller到Agent:一篇讲透EasyMesh协议里的那些“黑话”与实战配置
  • 从Modbus报文到角度值:手把手教你用三菱FX3U的RS2指令读取绝对值编码器
  • 华为ENSP模拟器实战:手把手教你配置LACP链路聚合,实现带宽翻倍与链路备份
  • 告别舵机抖动!用PCA9685驱动16路舵机,51单片机/STM32代码实测(附Proteus仿真文件)
  • 数科OFD阅读历史清理全攻略:统信UOS/麒麟KYLINOS下图形界面与命令行两种方法实测
  • 【Perplexity读书笔记生成黄金公式】:基于127篇实证测试报告,提炼出精准摘要+批判性批注+知识图谱联动的三阶模型
  • 论性能测试
  • 合宙ESP32 S3接SD卡模块总失败?可能是HSPI和VSPI的坑(附完整引脚配置)
  • 别再死记硬背了!用Python和C语言两种方式,带你一步步手算Modbus CRC16校验码
  • 深入理解PCIe地址转换(ATU):以DW控制器为例,图解Inbound/Outbound与DMA配置
  • 别再为AR发布头疼了!Unity + Vuforia打包安卓APK的完整避坑清单(从Player Settings到Quality)
  • 3分钟搞定音乐格式转换:你的私人音乐解锁神器使用全攻略
  • Qt QAction的隐藏玩法:除了菜单,还能用在工具栏、快捷键和右键菜单?
  • LAMMPS模拟避坑指南:用fix deform做石墨烯拉伸,为什么我建议新手先别用velocity方式?
  • 论文排版不求人:手把手教你用Word样式搞定独立目录、分栏与页眉页脚
  • 2026年Q2日本红枫苗木选购评测:鸡爪槭苗木/乌桕苗木/巨紫荆苗木/朴树苗木/榉树苗木/樱花苗木/欧洲枫香苗木/选择指南 - 优质品牌商家
  • RT-Thread Studio安装后别急着关:手把手带你完成第一个‘点亮LED’的STM32项目
  • 别再只调参数了!深入Niagara自定义模块:从看懂官方示例到写出自己的第一个功能
  • 顶会超神思路!扩散模型+Transformer,速度精度双飞升!
  • 2026靖江网络公司评测:靖江网站建设/兴化AI优化/兴化做网站/兴化网站优化/兴化网站建设/姜堰geo优化/姜堰网站优化/选择指南 - 优质品牌商家
  • 2026年Q2氨分解设备诚信标杆名录:氨分解发生炉/氨分解纯化/稀土行业用氨分解/立方制氮装置/冶金行业用制氮机/选择指南 - 优质品牌商家
  • 城市网格化治理平台