当前位置：首页 > news >正文

AI Berkshire：多Agent协作的价值投资框架，让AI成为你的专业投研团队

news 2026/7/3 1:00:07

如果你问 ChatGPT 或 Claude “拼多多值不值得买”，大概率会得到一篇“一方面增长强劲，另一方面竞争激烈，建议投资者谨慎决策”的平衡分析。这种回答看似全面，实则毫无用处——它没有帮你做出任何决策，只是把信息重新排列组合了一遍。

这正是当前 AI 在专业领域应用的最大痛点：它擅长信息整理，却难以形成可执行的、有纪律的深度判断。而 GitHub 上 Star 数超过 8.1k 的开源项目AI Berkshire，正是为了解决这个问题而生。它不是一个简单的提示词合集，而是一个将巴菲特、芒格、段永平、李录四位价值投资大师的方法论系统化、结构化，并通过多 AI Agent 协作实现的专业级投资研究框架。

简单来说，AI Berkshire 让你“一个人 + Claude Code / Codex = 一个投研团队”。它最核心的价值在于，将 AI 从一个“信息复读机”变成了一个具备结构化思维、反偏见机制和金融计算严谨性的“分析师团队”。根据项目披露的实盘数据，这套框架在 2024 和 2025 年分别取得了 +69.29% 和 +66.38% 的收益，大幅跑赢同期全球主要指数。

本文将为你完整拆解 AI Berkshire 的设计理念、核心功能、安装部署和实战应用。无论你是对 AI Agent 协作开发感兴趣的技术开发者，还是希望借助 AI 提升个人投资研究效率的投资者，这篇文章都将提供一个从零到一的清晰路径。你会发现，真正的 AI 赋能，不是让机器说更多正确的废话，而是让它帮你建立一套可重复、可验证、能对抗人性弱点的决策系统。

1. AI Berkshire 解决了什么问题：从“信息整理”到“决策支持”

在深入技术细节之前，我们必须先理解 AI Berkshire 要解决的根本矛盾。直接问大语言模型投资问题，通常有三大缺陷：

结论模糊，无法决策：AI 倾向于给出“平衡”的答案，避免承担风险，导致结论模棱两可。
视角单一，缺乏对抗：单一提示词只能提供一个视角，无法模拟真实决策中不同思维模式的碰撞与挑战。
数据幻觉与计算错误：LLM 不擅长精确计算，在市值、PE 等关键财务数据上容易出错，且会“自信地”编造不存在的数据。

AI Berkshire 的解决方案是构建一个“多 Agent 对抗性分析”系统。它不是一个超级智能体，而是四个各司其职、互相挑战的“分析师”：

段永平视角 (商业模式)：追问“这是不是一门好生意？生意的本质是什么？”
巴菲特视角 (护城河与财务)：分析竞争优势、财务健康度和安全边际。
芒格视角 (逆向思考与风险)：专门思考“这家公司会在什么情况下失败？”
李录视角 (文明趋势与长期确定性)：判断公司是否顺应长期历史潮流，10年后是否还能存在。

这四个 Agent 会并行工作，独立搜索信息、交叉验证数据、并给出各自独立的评分和结论。最终，由一个“Team Lead”角色来综合研判，形成一份带有明确“通过/不通过/灰色地带”结论，以及具体价格区间和仓位建议的报告。

这种设计带来的质变是：你得到的不是一份 AI 生成的“研报”，而是一个经过结构化流程和多视角对抗后产生的投资决策备忘录。它强制 AI 给出明确观点，并为这个观点提供来自四个不同维度的证据链支撑。

2. 核心架构与设计理念

AI Berkshire 的整体架构清晰分为三层，体现了其工程化的设计思想。

2.1 三层架构解析

Skill 层 (用户接口)：这是用户直接交互的入口。AI Berkshire 将复杂的投研工作流抽象成了 18 个明确的Skill（在 Claude Code 中表现为/commands，在 Codex 中表现为skills）。用户无需记忆复杂流程，只需调用对应的 Skill 并输入目标（如公司名、行业名），即可启动相应分析。这些 Skill 分为五大类：深度研究、财报分析、行业筛选、持仓管理、思维工具，覆盖了从选股、分析到跟踪、归因的全流程。
Agent 层 (核心引擎)：这是框架的“大脑”。每个 Skill 在执行时，内部会启动多个独立的 AI Agent 进行并行研究。以核心的/investment-team为例，它会同时启动上述四个大师视角的 Agent。每个 Agent 都拥有独立的上下文、搜索权限和思考过程，它们会像真实的投研团队一样，从不同角度切入问题，甚至互相辩论。这种“多 Agent 协作”模式，极大地扩展了单次分析的信息广度和思维深度。
工具层 (质量保障)：这是框架的“双手”，确保分析的严谨性。核心是一个名为financial_rigor.py的 Python 工具集，它解决了 LLM 在金融场景下的两大顽疾：
- 计算精度：所有财务计算使用 Python 的decimal.Decimal进行精确十进制运算，彻底避免浮点数误差。
- 数据验证：提供市值验算、多源数据交叉验证（误差超 1% 即告警）、Benford 定律检测（用于发现财务造假迹象）等功能。

2.2 核心设计哲学：对抗与制衡

AI Berkshire 的精髓不在于“融合”四位大师的观点，而在于刻意制造“对抗”。这种对抗是避免认知偏误的关键。

当段永平（商业模式）给出高分时，芒格（逆向思考）会立刻追问：“什么情况下这个商业模式会崩溃？竞争对手最快需要多久能复制？”
当巴菲特（财务估值）认为极度便宜时，李录（长期确定性）会审视：“10年后这个行业还存在吗？公司的管理层文化能保证它穿越周期吗？”

这种设计迫使分析必须触及问题的本质和反面，而不是流于表面的罗列。它模拟了顶级投资机构内部“投委会”的辩论过程，将 AI 从“助理”提升到了“合伙人”的层面。

3. 环境准备与快速安装

AI Berkshire 同时支持 Anthropic 的Claude Code和 OpenAI 的Codex两款 AI 编程助手客户端。你需要先安装其中一款。

3.1 安装 AI 客户端

对于 Claude Code 用户：

npm install -g @anthropic-ai/claude-code

安装后，在终端输入claude即可启动。

对于 Codex 用户：

# macOS / Linux curl -fsSL https://chatgpt.com/codex/install.sh | sh # 或使用 npm npm install -g @openai/codex # 或使用 Homebrew (macOS) brew install --cask codex # 验证安装 codex --version

Windows 用户可以使用 PowerShell 安装：

powershell -ExecutionPolicy ByPass -c "irm https://chatgpt.com/codex/install.ps1 | iex"

3.2 安装 AI Berkshire Skills

克隆项目仓库：

git clone https://github.com/xbtlin/ai-berkshire.git cd ai-berkshire

根据你的客户端安装 Skills：
Claude Code 用户：运行安装脚本，将 Skills 复制到 Claude Code 的全局 commands 目录。
```
./scripts/install-claude-commands.sh
```
Codex 用户：运行安装脚本，生成并安装 Skills 到 Codex 的本地技能目录。
```
./scripts/install-codex-skills.sh
```
（可选）如果你希望获得类似 Claude Code 中/command的快捷输入体验，可以额外安装 slash prompts：
```
./scripts/install-codex-prompts.sh
```
权限处理（Claude Code 用户注意）：由于 Skills 会频繁调用网络搜索、文件读写等工具，Claude Code 默认会为每个工具调用弹出授权确认。如果你在可信环境中使用，可以启动跳过权限确认模式以提升体验：
```
claude --dangerously-skip-permissions
```
请注意：此模式会关闭安全确认，仅建议在你完全信任当前工作目录和命令时使用。

安装完成后，重启你的 Claude Code 或 Codex 客户端，Skills 即可生效。

4. 核心 Skill 实战详解

AI Berkshire 提供了 18 个 Skill，这里重点剖析几个最具代表性的，并通过示例展示其强大之处。

4.1`/investment-research`：单公司深度研究

这是最全面的分析入口，会对一家公司执行从数据收集到最终决策的七步完整流程。

使用示例：在 Claude Code 聊天框中直接输入：

/investment-research 腾讯控股

或在 Codex 中描述任务：

使用 investment-research 研究腾讯控股

输出核心：

结构化报告：报告严格按“生意本质 -> 护城河 -> 逆向风险 -> 管理层 -> 文明趋势 -> 估值”的结构输出，确保每次分析维度一致。
信息置信度评级：对每个数据点标注 A/B/C 级置信度，提醒你哪些判断是基于充足信息，哪些存在推测。
强制结论：报告末尾会给出明确的综合评分（如 4.7/5）和投资建议（通过/有条件通过/灰色地带），并附上针对不同风险偏好投资者（激进、稳健、保守）的具体操作建议和价格区间。
大师原话模拟：会以“段永平说：...”、“芒格追问：...”的形式，将大师的思维模式融入分析，而不仅仅是贴标签。

4.2`/investment-team`：多 Agent 并行投研

这是框架能力的集中体现。它同时启动 4 个 Agent，并行完成对同一家公司的研究。

使用示例：

/investment-team 美团

工作流程与输出：

并行研究：四个 Agent（商业模式、财务估值、行业竞争、风险与管理层）同时开始工作，各自进行网络搜索、数据抓取和分析。
独立结论：每个 Agent 会生成自己视角下的独立报告和评分。
综合研判：Team Lead 汇总四份报告，处理冲突点，形成最终的统一结论和投资建议表。

其价值在于：你相当于在几分钟内，召集了四个背景各异的分析师开了个投研会，并且他们每个人都做了充分的功课。这比单个 AI 顺序思考的深度和广度有指数级提升。

4.3`/investment-checklist`：快速筛查过滤器

当你面对大量公司无从下手时，这个 Skill 能在 10 分钟内用巴菲特的六条标准进行快速过滤。

使用示例（支持多公司对比）：

/investment-checklist 茅台, 英伟达, 苹果, 特斯拉

六关筛选流程：

能力圈：我能理解这家公司吗？
好生意：它的经济特征优秀吗？（高ROIC，低资本需求）
护城河：它的竞争优势可持续吗？
管理层：管理者值得信任且能干吗？
安全边际：价格相对于内在价值足够便宜吗？
决策纪律：我的买入决定是理性的，还是出于 FOMO（错失恐惧）？

最终，它会输出一个清晰的对比表格，并附上“镜子测试”——要求你用不超过 5 句话清晰陈述买入理由。如果说不清，则自动否决。

4.4`/news-pulse`：股价异动快速归因

这是用于持仓管理的利器。当持仓股票突然大涨或大跌时，它能帮你快速（10-15分钟）厘清原因，避免情绪化操作。

使用示例：

/news-pulse 腾讯 /news-pulse 拼多多 跌12% 一周内

核心功能：

四维侦察：同时从公司事件、监管政策、行业对手、市场情绪（卖方报告、大V观点、资金流向）四个维度搜集信息。
归因排序：不是罗列新闻，而是判断哪个事件最可能“配得上”此次股价波动的幅度。
性质判断：明确区分是“价值事件”（基本面变化）、 “情绪波动”、“真因不明”还是“混合型”。
行动建议：直接给出“触发深度研究”、“重审投资逻辑”或“仅需观察”的操作建议。

5. 金融严谨性工具：告别 LLM 的“数学幻觉”

LLM 在数学计算上的不可靠性是金融应用的一大障碍。AI Berkshire 通过本地 Python 工具链彻底解决了这个问题。

项目中的tools/financial_rigor.py提供了以下关键命令：

# 1. 市值验算：防止港币/人民币等单位混淆导致的重大错误 python3 tools/financial_rigor.py verify-market-cap \ --price 510 \ # 股价 --shares 9.11e9 \ # 总股本 --reported 4.65e12 \ # 报告中的市值 --currency HKD # 货币单位 # 输出：✅ 验证通过，偏差 0.08% # 2. 多源交叉验证：确保关键数据可靠 python3 tools/financial_rigor.py cross-validate \ --metric "PE_Ratio" \ --sources 15.3 16.1 14.8 \ # 从不同来源获取的PE值 --tolerance 0.05 # 容忍5%的偏差 # 如果某个源数据偏离过大，会发出警告。 # 3. 三情景估值计算：乐观、中性、悲观假设下的估值区间 python3 tools/financial_rigor.py three-scenario \ --base-fcf 100 \ # 基准自由现金流（单位：亿） --growth-rates "0.15 0.10 0.05" \ # 乐观/中性/悲观增长率 --wacc 0.08 \ # 加权平均资本成本 --terminal-growth 0.02 # 永续增长率 # 输出三个情景下的内在价值区间。 # 4. Benford定律检测：初步筛查财务数据异常 python3 tools/financial_rigor.py benford \ --data-file revenue_digits.csv # 收入数字列表 # 分析首位数字分布是否符合自然规律，异常可能提示财务问题。

这些工具被深度集成到各个 Skill 中。当 Agent 需要计算 PE、市值或进行 DCF 估值时，会自动调用这些本地工具执行精确计算，并将结果返回给 LLM 进行推理。这保证了分析报告的数学基础是坚实无误的。

6. 实战案例：如何用 AI Berkshire 分析一家公司

让我们以分析“美团”为例，串联起核心技能的使用。

第一步：快速初筛当你对美团感兴趣时，首先用 Checklist 进行快速过滤。

/investment-checklist 美团

这个过程大约2-3分钟，它会告诉你美团是否值得你花更多时间深入研究。如果输出显示在“能力圈”、“好生意”等关键关卡通过，则进入下一步。

第二步：深度并行研究启动多 Agent 团队进行全方位剖析。

/investment-team 美团

等待5-10分钟，你会得到一份包含四维度评分、综合结论和具体操作建议的报告。报告可能会指出：美团在本地生活的网络效应护城河（段永平视角）很强，当前估值（巴菲特视角）处于历史低位，但需警惕抖音在到店业务的竞争（芒格视角）。

第三步：关键问题深挖如果报告中对管理层或某项新业务（如美团优选）存在疑虑，可以使用特定技能深入。

/management-deep-dive 王兴 美团

这个 Skill 会聚焦于管理层的背景、历史决策、股权结构、薪酬体系等，评估其是否值得信赖。

第四步：持仓管理与跟踪假设你基于报告决定买入，后续可以使用持仓管理技能。

定期复盘：/portfolio-review 美团30%，腾讯40%，现金30%来审视整体组合的健康度。
论文跟踪：/thesis-tracker 美团来持续监控你当初买入的核心逻辑（如“外卖业务利润率持续提升”）是否被证实或证伪。
异动归因：某天美团股价大跌，立即使用/news-pulse 美团，快速判断是市场情绪、行业政策还是公司基本面出了问题，避免盲目止损。

这一套流程，将一个非专业的个人投资者，武装成了一个拥有标准化研究流程、交叉验证机制和持续跟踪纪律的迷你投资机构。

7. 常见问题与排查思路

在安装和使用 AI Berkshire 过程中，你可能会遇到以下问题：

问题现象	可能原因	排查方式	解决方案
Claude Code 中无法识别`/`命令	Skills 未正确安装或路径不对	在 Claude Code 中尝试输入`/`查看命令列表	1. 确认已运行`install-claude-commands.sh`。 2. 检查 Claude Code 的全局 commands 目录权限。 3. 重启 Claude Code 客户端。
Codex 中调用 skill 无反应	Skill 未安装或未加载	在 Codex 聊天框输入`使用 investment-research 研究腾讯`看是否有对应动作	1. 确认已运行`install-codex-skills.sh`。 2. 重启 Codex 客户端。 3. 检查`~/.codex/skills`目录下是否有对应技能文件夹。
工具调用被频繁要求授权 (Claude Code)	Claude Code 默认安全设置	每次调用网络搜索、文件读取时都会弹出确认	1. 接受授权。 2. 或在可信环境下使用`claude --dangerously-skip-permissions`启动（需谨慎）。
财务数据获取失败或错误	网络问题或数据源不可用	观察 Agent 执行日志，看是哪一步数据抓取出错	1. 检查网络连接。 2. 项目依赖公开数据源，某些国内公司数据可能受限，可尝试使用公司股票代码（如`0700.HK`）或英文名。
分析报告深度不够	可能受限于 Claude/Codex 模型本身的上下文和理解能力	对比不同模型版本（如 Claude 3.5 Sonnet vs Haiku）的输出	1. 确保使用能力最强的模型版本。 2. 在 Skill 调用时，可以附加更详细的指令，如`/investment-research 腾讯请重点分析视频号对广告业务的贡献`。
“镜子测试”无法通过	对公司的理解确实不深入	审视报告中的“能力圈”评分和阐述	这可能是框架最有价值的反馈——它告诉你，你其实并不真正理解这家公司。此时应放弃投资，或回归第一步进行更基础的学习。

8. 最佳实践与高级使用技巧

要让 AI Berkshire 发挥最大效力，不仅在于会用，更在于用得巧。

从 Checklist 开始，用 Team 深入：不要一上来就对陌生公司使用/investment-team，耗时且可能浪费资源。先用/investment-checklist快速过滤掉明显不符合标准的公司，对通过的标的再启动深度研究。
善用“灰色地带”结论：框架的结论除了“通过”和“不通过”，还有“灰色地带”。这通常意味着数据不足或关键变量存在巨大不确定性（如政策风险、技术路径未定）。“灰色地带”不是失败，而是最重要的风险提示，它告诉你这里需要人类更高阶的判断或更长时间的观察。
交叉使用不同 Skill 进行验证：对于重点公司，可以先后使用/investment-research（系统化）和/investment-team（并行化）进行分析，对比两份报告的侧重点和结论是否一致。也可以用/earnings-review仔细研读最新财报，验证深度报告中的财务假设。
建立自己的研究档案：将 AI Berkshire 生成的所有报告保存下来。半年或一年后，对同一家公司再次运行分析，使用/thesis-tracker对比新旧报告，看哪些判断被验证，哪些被证伪。这是提升你自身投资认知的最佳方式。
理解框架的边界：
- 它不是预测工具：AI Berkshire 分析的是公司的质地和价格的关系，不预测短期股价走势。
- 它依赖公开信息：其分析质量受限于网络可获取的公开数据。对于内幕信息或未公开的细节，它无能为力。
- 它不能替代你的最终决策：框架输出的是“决策支持”，而不是“决策本身”。最后的买入、持有、卖出按钮，必须由你亲手按下，并对结果负全部责任。
关注工具层更新：定期关注项目 GitHub 仓库的更新，尤其是tools/目录下的金融工具。作者可能会增加新的数据源接入（如通过 MCP 协议接入 Bloomberg、Wind 等）或更强大的分析工具。