当前位置: 首页 > news >正文

AI Berkshire:多Agent协作的价值投资框架,让AI成为你的专业投研团队

如果你问 ChatGPT 或 Claude “拼多多值不值得买”,大概率会得到一篇“一方面增长强劲,另一方面竞争激烈,建议投资者谨慎决策”的平衡分析。这种回答看似全面,实则毫无用处——它没有帮你做出任何决策,只是把信息重新排列组合了一遍。

这正是当前 AI 在专业领域应用的最大痛点:它擅长信息整理,却难以形成可执行的、有纪律的深度判断。而 GitHub 上 Star 数超过 8.1k 的开源项目AI Berkshire,正是为了解决这个问题而生。它不是一个简单的提示词合集,而是一个将巴菲特、芒格、段永平、李录四位价值投资大师的方法论系统化、结构化,并通过多 AI Agent 协作实现的专业级投资研究框架

简单来说,AI Berkshire 让你“一个人 + Claude Code / Codex = 一个投研团队”。它最核心的价值在于,将 AI 从一个“信息复读机”变成了一个具备结构化思维、反偏见机制和金融计算严谨性的“分析师团队”。根据项目披露的实盘数据,这套框架在 2024 和 2025 年分别取得了 +69.29% 和 +66.38% 的收益,大幅跑赢同期全球主要指数。

本文将为你完整拆解 AI Berkshire 的设计理念、核心功能、安装部署和实战应用。无论你是对 AI Agent 协作开发感兴趣的技术开发者,还是希望借助 AI 提升个人投资研究效率的投资者,这篇文章都将提供一个从零到一的清晰路径。你会发现,真正的 AI 赋能,不是让机器说更多正确的废话,而是让它帮你建立一套可重复、可验证、能对抗人性弱点的决策系统。

1. AI Berkshire 解决了什么问题:从“信息整理”到“决策支持”

在深入技术细节之前,我们必须先理解 AI Berkshire 要解决的根本矛盾。直接问大语言模型投资问题,通常有三大缺陷:

  1. 结论模糊,无法决策:AI 倾向于给出“平衡”的答案,避免承担风险,导致结论模棱两可。
  2. 视角单一,缺乏对抗:单一提示词只能提供一个视角,无法模拟真实决策中不同思维模式的碰撞与挑战。
  3. 数据幻觉与计算错误:LLM 不擅长精确计算,在市值、PE 等关键财务数据上容易出错,且会“自信地”编造不存在的数据。

AI Berkshire 的解决方案是构建一个“多 Agent 对抗性分析”系统。它不是一个超级智能体,而是四个各司其职、互相挑战的“分析师”:

  • 段永平视角 (商业模式):追问“这是不是一门好生意?生意的本质是什么?”
  • 巴菲特视角 (护城河与财务):分析竞争优势、财务健康度和安全边际。
  • 芒格视角 (逆向思考与风险):专门思考“这家公司会在什么情况下失败?”
  • 李录视角 (文明趋势与长期确定性):判断公司是否顺应长期历史潮流,10年后是否还能存在。

这四个 Agent 会并行工作,独立搜索信息、交叉验证数据、并给出各自独立的评分和结论。最终,由一个“Team Lead”角色来综合研判,形成一份带有明确“通过/不通过/灰色地带”结论,以及具体价格区间和仓位建议的报告。

这种设计带来的质变是:你得到的不是一份 AI 生成的“研报”,而是一个经过结构化流程多视角对抗后产生的投资决策备忘录。它强制 AI 给出明确观点,并为这个观点提供来自四个不同维度的证据链支撑。

2. 核心架构与设计理念

AI Berkshire 的整体架构清晰分为三层,体现了其工程化的设计思想。

2.1 三层架构解析

  1. Skill 层 (用户接口): 这是用户直接交互的入口。AI Berkshire 将复杂的投研工作流抽象成了 18 个明确的Skill(在 Claude Code 中表现为/commands,在 Codex 中表现为skills)。用户无需记忆复杂流程,只需调用对应的 Skill 并输入目标(如公司名、行业名),即可启动相应分析。 这些 Skill 分为五大类:深度研究、财报分析、行业筛选、持仓管理、思维工具,覆盖了从选股、分析到跟踪、归因的全流程。

  2. Agent 层 (核心引擎): 这是框架的“大脑”。每个 Skill 在执行时,内部会启动多个独立的 AI Agent 进行并行研究。以核心的/investment-team为例,它会同时启动上述四个大师视角的 Agent。每个 Agent 都拥有独立的上下文、搜索权限和思考过程,它们会像真实的投研团队一样,从不同角度切入问题,甚至互相辩论。这种“多 Agent 协作”模式,极大地扩展了单次分析的信息广度和思维深度。

  3. 工具层 (质量保障): 这是框架的“双手”,确保分析的严谨性。核心是一个名为financial_rigor.py的 Python 工具集,它解决了 LLM 在金融场景下的两大顽疾:

    • 计算精度:所有财务计算使用 Python 的decimal.Decimal进行精确十进制运算,彻底避免浮点数误差。
    • 数据验证:提供市值验算、多源数据交叉验证(误差超 1% 即告警)、Benford 定律检测(用于发现财务造假迹象)等功能。

2.2 核心设计哲学:对抗与制衡

AI Berkshire 的精髓不在于“融合”四位大师的观点,而在于刻意制造“对抗”。这种对抗是避免认知偏误的关键。

  • 当段永平(商业模式)给出高分时,芒格(逆向思考)会立刻追问:“什么情况下这个商业模式会崩溃?竞争对手最快需要多久能复制?”
  • 当巴菲特(财务估值)认为极度便宜时,李录(长期确定性)会审视:“10年后这个行业还存在吗?公司的管理层文化能保证它穿越周期吗?”

这种设计迫使分析必须触及问题的本质和反面,而不是流于表面的罗列。它模拟了顶级投资机构内部“投委会”的辩论过程,将 AI 从“助理”提升到了“合伙人”的层面。

3. 环境准备与快速安装

AI Berkshire 同时支持 Anthropic 的Claude Code和 OpenAI 的Codex两款 AI 编程助手客户端。你需要先安装其中一款。

3.1 安装 AI 客户端

对于 Claude Code 用户:

npm install -g @anthropic-ai/claude-code

安装后,在终端输入claude即可启动。

对于 Codex 用户:

# macOS / Linux curl -fsSL https://chatgpt.com/codex/install.sh | sh # 或使用 npm npm install -g @openai/codex # 或使用 Homebrew (macOS) brew install --cask codex # 验证安装 codex --version

Windows 用户可以使用 PowerShell 安装:

powershell -ExecutionPolicy ByPass -c "irm https://chatgpt.com/codex/install.ps1 | iex"

3.2 安装 AI Berkshire Skills

  1. 克隆项目仓库:

    git clone https://github.com/xbtlin/ai-berkshire.git cd ai-berkshire
  2. 根据你的客户端安装 Skills:

    Claude Code 用户:运行安装脚本,将 Skills 复制到 Claude Code 的全局 commands 目录。

    ./scripts/install-claude-commands.sh

    Codex 用户:运行安装脚本,生成并安装 Skills 到 Codex 的本地技能目录。

    ./scripts/install-codex-skills.sh

    (可选)如果你希望获得类似 Claude Code 中/command的快捷输入体验,可以额外安装 slash prompts:

    ./scripts/install-codex-prompts.sh
  3. 权限处理(Claude Code 用户注意):由于 Skills 会频繁调用网络搜索、文件读写等工具,Claude Code 默认会为每个工具调用弹出授权确认。如果你在可信环境中使用,可以启动跳过权限确认模式以提升体验:

    claude --dangerously-skip-permissions

    请注意:此模式会关闭安全确认,仅建议在你完全信任当前工作目录和命令时使用。

安装完成后,重启你的 Claude Code 或 Codex 客户端,Skills 即可生效。

4. 核心 Skill 实战详解

AI Berkshire 提供了 18 个 Skill,这里重点剖析几个最具代表性的,并通过示例展示其强大之处。

4.1/investment-research:单公司深度研究

这是最全面的分析入口,会对一家公司执行从数据收集到最终决策的七步完整流程。

使用示例:在 Claude Code 聊天框中直接输入:

/investment-research 腾讯控股

或在 Codex 中描述任务:

使用 investment-research 研究腾讯控股

输出核心:

  1. 结构化报告:报告严格按“生意本质 -> 护城河 -> 逆向风险 -> 管理层 -> 文明趋势 -> 估值”的结构输出,确保每次分析维度一致。
  2. 信息置信度评级:对每个数据点标注 A/B/C 级置信度,提醒你哪些判断是基于充足信息,哪些存在推测。
  3. 强制结论:报告末尾会给出明确的综合评分(如 4.7/5)和投资建议(通过/有条件通过/灰色地带),并附上针对不同风险偏好投资者(激进、稳健、保守)的具体操作建议和价格区间。
  4. 大师原话模拟:会以“段永平说:...”、“芒格追问:...”的形式,将大师的思维模式融入分析,而不仅仅是贴标签。

4.2/investment-team:多 Agent 并行投研

这是框架能力的集中体现。它同时启动 4 个 Agent,并行完成对同一家公司的研究。

使用示例:

/investment-team 美团

工作流程与输出:

  1. 并行研究:四个 Agent(商业模式、财务估值、行业竞争、风险与管理层)同时开始工作,各自进行网络搜索、数据抓取和分析。
  2. 独立结论:每个 Agent 会生成自己视角下的独立报告和评分。
  3. 综合研判:Team Lead 汇总四份报告,处理冲突点,形成最终的统一结论和投资建议表。

其价值在于:你相当于在几分钟内,召集了四个背景各异的分析师开了个投研会,并且他们每个人都做了充分的功课。这比单个 AI 顺序思考的深度和广度有指数级提升。

4.3/investment-checklist:快速筛查过滤器

当你面对大量公司无从下手时,这个 Skill 能在 10 分钟内用巴菲特的六条标准进行快速过滤。

使用示例(支持多公司对比):

/investment-checklist 茅台, 英伟达, 苹果, 特斯拉

六关筛选流程:

  1. 能力圈:我能理解这家公司吗?
  2. 好生意:它的经济特征优秀吗?(高ROIC,低资本需求)
  3. 护城河:它的竞争优势可持续吗?
  4. 管理层:管理者值得信任且能干吗?
  5. 安全边际:价格相对于内在价值足够便宜吗?
  6. 决策纪律:我的买入决定是理性的,还是出于 FOMO(错失恐惧)?

最终,它会输出一个清晰的对比表格,并附上“镜子测试”——要求你用不超过 5 句话清晰陈述买入理由。如果说不清,则自动否决。

4.4/news-pulse:股价异动快速归因

这是用于持仓管理的利器。当持仓股票突然大涨或大跌时,它能帮你快速(10-15分钟)厘清原因,避免情绪化操作。

使用示例:

/news-pulse 腾讯 /news-pulse 拼多多 跌12% 一周内

核心功能:

  • 四维侦察:同时从公司事件、监管政策、行业对手、市场情绪(卖方报告、大V观点、资金流向)四个维度搜集信息。
  • 归因排序:不是罗列新闻,而是判断哪个事件最可能“配得上”此次股价波动的幅度。
  • 性质判断:明确区分是“价值事件”(基本面变化)、 “情绪波动”、“真因不明”还是“混合型”。
  • 行动建议:直接给出“触发深度研究”、“重审投资逻辑”或“仅需观察”的操作建议。

5. 金融严谨性工具:告别 LLM 的“数学幻觉”

LLM 在数学计算上的不可靠性是金融应用的一大障碍。AI Berkshire 通过本地 Python 工具链彻底解决了这个问题。

项目中的tools/financial_rigor.py提供了以下关键命令:

# 1. 市值验算:防止港币/人民币等单位混淆导致的重大错误 python3 tools/financial_rigor.py verify-market-cap \ --price 510 \ # 股价 --shares 9.11e9 \ # 总股本 --reported 4.65e12 \ # 报告中的市值 --currency HKD # 货币单位 # 输出:✅ 验证通过,偏差 0.08% # 2. 多源交叉验证:确保关键数据可靠 python3 tools/financial_rigor.py cross-validate \ --metric "PE_Ratio" \ --sources 15.3 16.1 14.8 \ # 从不同来源获取的PE值 --tolerance 0.05 # 容忍5%的偏差 # 如果某个源数据偏离过大,会发出警告。 # 3. 三情景估值计算:乐观、中性、悲观假设下的估值区间 python3 tools/financial_rigor.py three-scenario \ --base-fcf 100 \ # 基准自由现金流(单位:亿) --growth-rates "0.15 0.10 0.05" \ # 乐观/中性/悲观增长率 --wacc 0.08 \ # 加权平均资本成本 --terminal-growth 0.02 # 永续增长率 # 输出三个情景下的内在价值区间。 # 4. Benford定律检测:初步筛查财务数据异常 python3 tools/financial_rigor.py benford \ --data-file revenue_digits.csv # 收入数字列表 # 分析首位数字分布是否符合自然规律,异常可能提示财务问题。

这些工具被深度集成到各个 Skill 中。当 Agent 需要计算 PE、市值或进行 DCF 估值时,会自动调用这些本地工具执行精确计算,并将结果返回给 LLM 进行推理。这保证了分析报告的数学基础是坚实无误的。

6. 实战案例:如何用 AI Berkshire 分析一家公司

让我们以分析“美团”为例,串联起核心技能的使用。

第一步:快速初筛当你对美团感兴趣时,首先用 Checklist 进行快速过滤。

/investment-checklist 美团

这个过程大约2-3分钟,它会告诉你美团是否值得你花更多时间深入研究。如果输出显示在“能力圈”、“好生意”等关键关卡通过,则进入下一步。

第二步:深度并行研究启动多 Agent 团队进行全方位剖析。

/investment-team 美团

等待5-10分钟,你会得到一份包含四维度评分、综合结论和具体操作建议的报告。报告可能会指出:美团在本地生活的网络效应护城河(段永平视角)很强,当前估值(巴菲特视角)处于历史低位,但需警惕抖音在到店业务的竞争(芒格视角)。

第三步:关键问题深挖如果报告中对管理层或某项新业务(如美团优选)存在疑虑,可以使用特定技能深入。

/management-deep-dive 王兴 美团

这个 Skill 会聚焦于管理层的背景、历史决策、股权结构、薪酬体系等,评估其是否值得信赖。

第四步:持仓管理与跟踪假设你基于报告决定买入,后续可以使用持仓管理技能。

  • 定期复盘/portfolio-review 美团30%, 腾讯40%, 现金30%来审视整体组合的健康度。
  • 论文跟踪/thesis-tracker 美团来持续监控你当初买入的核心逻辑(如“外卖业务利润率持续提升”)是否被证实或证伪。
  • 异动归因:某天美团股价大跌,立即使用/news-pulse 美团,快速判断是市场情绪、行业政策还是公司基本面出了问题,避免盲目止损。

这一套流程,将一个非专业的个人投资者,武装成了一个拥有标准化研究流程、交叉验证机制和持续跟踪纪律的迷你投资机构。

7. 常见问题与排查思路

在安装和使用 AI Berkshire 过程中,你可能会遇到以下问题:

问题现象可能原因排查方式解决方案
Claude Code 中无法识别/命令Skills 未正确安装或路径不对在 Claude Code 中尝试输入/查看命令列表1. 确认已运行install-claude-commands.sh
2. 检查 Claude Code 的全局 commands 目录权限。
3. 重启 Claude Code 客户端。
Codex 中调用 skill 无反应Skill 未安装或未加载在 Codex 聊天框输入使用 investment-research 研究腾讯看是否有对应动作1. 确认已运行install-codex-skills.sh
2. 重启 Codex 客户端。
3. 检查~/.codex/skills目录下是否有对应技能文件夹。
工具调用被频繁要求授权 (Claude Code)Claude Code 默认安全设置每次调用网络搜索、文件读取时都会弹出确认1. 接受授权。
2. 或在可信环境下使用claude --dangerously-skip-permissions启动(需谨慎)。
财务数据获取失败或错误网络问题或数据源不可用观察 Agent 执行日志,看是哪一步数据抓取出错1. 检查网络连接。
2. 项目依赖公开数据源,某些国内公司数据可能受限,可尝试使用公司股票代码(如0700.HK)或英文名。
分析报告深度不够可能受限于 Claude/Codex 模型本身的上下文和理解能力对比不同模型版本(如 Claude 3.5 Sonnet vs Haiku)的输出1. 确保使用能力最强的模型版本。
2. 在 Skill 调用时,可以附加更详细的指令,如/investment-research 腾讯 请重点分析视频号对广告业务的贡献
“镜子测试”无法通过对公司的理解确实不深入审视报告中的“能力圈”评分和阐述这可能是框架最有价值的反馈——它告诉你,你其实并不真正理解这家公司。此时应放弃投资,或回归第一步进行更基础的学习。

8. 最佳实践与高级使用技巧

要让 AI Berkshire 发挥最大效力,不仅在于会用,更在于用得巧。

  1. 从 Checklist 开始,用 Team 深入:不要一上来就对陌生公司使用/investment-team,耗时且可能浪费资源。先用/investment-checklist快速过滤掉明显不符合标准的公司,对通过的标的再启动深度研究。

  2. 善用“灰色地带”结论:框架的结论除了“通过”和“不通过”,还有“灰色地带”。这通常意味着数据不足或关键变量存在巨大不确定性(如政策风险、技术路径未定)。“灰色地带”不是失败,而是最重要的风险提示,它告诉你这里需要人类更高阶的判断或更长时间的观察。

  3. 交叉使用不同 Skill 进行验证:对于重点公司,可以先后使用/investment-research(系统化)和/investment-team(并行化)进行分析,对比两份报告的侧重点和结论是否一致。也可以用/earnings-review仔细研读最新财报,验证深度报告中的财务假设。

  4. 建立自己的研究档案:将 AI Berkshire 生成的所有报告保存下来。半年或一年后,对同一家公司再次运行分析,使用/thesis-tracker对比新旧报告,看哪些判断被验证,哪些被证伪。这是提升你自身投资认知的最佳方式。

  5. 理解框架的边界

    • 它不是预测工具:AI Berkshire 分析的是公司的质地和价格的关系,不预测短期股价走势。
    • 它依赖公开信息:其分析质量受限于网络可获取的公开数据。对于内幕信息或未公开的细节,它无能为力。
    • 它不能替代你的最终决策:框架输出的是“决策支持”,而不是“决策本身”。最后的买入、持有、卖出按钮,必须由你亲手按下,并对结果负全部责任。
  6. 关注工具层更新:定期关注项目 GitHub 仓库的更新,尤其是tools/目录下的金融工具。作者可能会增加新的数据源接入(如通过 MCP 协议接入 Bloomberg、Wind 等)或更强大的分析工具。

9. 总结:从“玩票”到“专业”的桥梁

AI Berkshire 的出现,标志着一个转折点:AI 在专业领域的应用,正从“玩具”和“助手”,迈向“协作伙伴”和“流程引擎”。它提供的不是又一个聊天界面,而是一套可重复、可验证、具备内在制衡机制的决策系统。

对于开发者而言,这是一个绝佳的多 Agent 协作系统的实战案例,展示了如何将复杂的领域知识(价值投资)工程化为一系列可执行的 AI 技能和严谨的工具链。

对于投资者而言,这可能是第一次有机会以极低的成本,拥有一个“7x24小时工作、不受情绪影响、融合大师智慧、计算绝对精准”的个人投研团队。它不能保证你赚钱——没有任何工具可以——但它能极大地提高你投资决策过程的理性程度和纪律性

最终,AI Berkshire 的价值不在于给出一个“必涨代码”,而在于它强制你遵循一个优秀的决策流程。在这个流程中,AI 负责提供广度、深度和计算,而你,负责提供最终的判断、勇气和承担责任的肩膀。这或许是人机协作在投资领域最理想的形态。

下一步你可以

  1. 按照第 3 节的步骤,在你的 Claude Code 或 Codex 中安装并尝试第一个 Skill。
  2. 从一个你非常熟悉的公司(比如你所在行业的公司)开始分析,感受框架的分析逻辑与你自己认知的异同。
  3. 查阅项目docs/目录下的实战报告,理解一份高质量输出应该长什么样。
  4. 思考如何将这套框架的“多 Agent 对抗”和“工具链严谨性”思想,迁移到你自己的专业领域中去。
http://www.jsqmd.com/news/1112203/

相关文章:

  • 数据密集型 MCP Server:PostgreSQL 慢查询分析与自动调优
  • MAX9744与PIC18F86J16音频功率放大方案详解
  • 数字逃避行为识别与PTSD早期干预系统设计
  • AI专著撰写秘籍!AI写专著工具助力,快速生成20万字专著且格式规范!
  • AI Agent的实时感知与决策:流式处理与事件驱动架构
  • 上次骂了DeepSeekV4Flash,今天发现Pro的智商也一样
  • 如何用AI控制Figma:5大智能设计协作功能详解
  • HSTracker:macOS炉石传说智能辅助工具终极指南
  • Java毕业设计-基于 SpringBoot 的个性化课程推荐系统的设计与实现 基于 SpringBoot 的个性化教学信息推荐平台(源码+LW+部署文档+全bao+远程调试+代码讲解等)
  • Appium移动端自动化测试:从核心原理到实战案例完整指南
  • Simple Runtime Window Editor:免费工具终极指南,如何突破游戏窗口限制
  • 终极指南:使用yuzu模拟器在PC上畅玩Switch游戏的完整教程
  • 端侧 AI 推理部署:操作系统边界决定产品体验
  • 解锁B站缓存视频:m4s-converter技术实践指南
  • TPS65263三重降压转换器在嵌入式电源管理中的应用
  • Python+Playwright+Pytest:构建现代化UI自动化测试框架全攻略
  • GetQzonehistory:3分钟找回你丢失的QQ空间青春记忆
  • 3步快速掌握国家中小学智慧教育平台电子课本下载:教师备课效率倍增终极指南
  • AI模型推理性能调优实战:从剪枝量化到硬件加速
  • AI工程化落地的四大关键切口:代码生成、轻量化、多模态与企业部署
  • Agent的“资历已死”时代:22岁新人如何用Agent交付博士级工程
  • AI发票识别技术:OCR与结构化解析实战指南
  • 终极音乐解锁工具:3分钟打破平台限制,免费拥有你的音乐
  • LSM Compaction 调优:写放大不是一个参数能解决
  • 如何让Android手机变身万能键盘鼠标:USB HID Client完全指南
  • Sora2视频生成API接入与实战指南
  • STM32与EEPROM高速数据检索优化方案
  • GPTs商业化落地首周数据报告:TOP10盈利模型曝光,其中2个已获OpenAI官方推荐(附转化漏斗SOP)
  • 如何免费获取八大网盘真实下载地址:网盘直链下载助手终极指南
  • 如何快速掌握FGO自动战斗工具:Fate/Grand Automata完整配置指南