当前位置：首页 > news >正文

手把手搭一个不会忘的知识库

news 2026/5/29 5:17:58

这篇是教程。

上一篇聊了 Karpathy 的 LLM Wiki[1] 思路。这篇把它落地。

不需要写代码。不需要部署服务器。一台电脑，一个 AI Agent，一个下午，就能搭起来。

先说清楚我们要搭的是什么。

核心就一件事。AI 回答完之后，有价值的东西写回知识库。下次再问，它已经知道了。

不再每次从零开始。

好。开始搭。

第一步：建目录结构

在你电脑上找个地方，建一个文件夹。我用的是 Obsidian，你用任何支持 Markdown 的工具都行。

目录长这样。

my-wiki/├── raw/ ← 原始资料，只读不改├── wiki/ ← 知识层，AI 维护的地方│ ├── index.md ← 内容地图│ └── log.md ← 操作日志└── AGENTS.md ← 规则文件，告诉 AI 怎么干活

三个部分。三个职责。

raw/ 是仓库。只往里放东西，不改里面的内容。

wiki/ 是车间。AI 在这里加工、整理、更新。

AGENTS.md 是规矩。没有它，AI 每次整理的方式都不一样。有了它，wiki 才不会越来越乱。

想了想。这就像开一家店。raw/ 是进货的仓库。wiki/ 是货架。AGENTS.md 是店员手册。没有手册，每个店员摆货的方式都不一样。有了手册，谁来都能接手。

第二步：写 AGENTS.md

这是最关键的一步。很多人跳过了，后面就乱了。

AGENTS.md 不需要写很长。但几件事必须说清楚。

我自己用的模板长这样。你可以直接复制，然后根据自己的情况改。

# Wiki 维护规则## 目录结构- raw/ 存放原始资料，只读不改- wiki/ 存放整理后的知识页面- wiki/index.md 是内容地图，每次更新 wiki 后必须同步更新- wiki/log.md 是操作日志，每次操作后追加一条记录## 页面类型- 摘要页：一篇资料对应一页摘要，文件名用 summary-原文标题.md- 概念页：一个概念一页，文件名用 concept-概念名.md- 对比页：多个东西的对比，文件名用 compare-主题.md## 格式要求- 每页开头写一句话摘要- 必须标注来源，格式：[来源：raw/文件名]- 页面之间用 [[双链]] 互相引用## 回写规则- 每次回答用户问题后，如果产生了新的结论或发现，写一页新的 wiki 页面- 更新 index.md- 在 log.md 追加一条记录## 人工复核- AI 不确定的内容，在页面顶部标注 [待复核]- 涉及数据、结论、判断的页面，标注 [需人工验证]

这就是 Karpathy 说的 Schema 层。看着简单。但没有它，wiki 三天就乱了。

第三步：准备你的第一批资料

不要贪多。

找一个你最近反复在看的主题。挑3到5份资料。放进 raw/ 目录。

可以是文章的 Markdown 文件。可以是论文的 PDF。可以是你自己的笔记。可以是网页的截图。

我第一次试的时候，放了3篇关于 AI Agent 的文章。

够了。先跑通流程，再扩大规模。

第四步：让 AI 做第一次 ingest

打开你的 AI Agent。Claude Code、Cursor、Kiro，都行。

把整个 my-wiki/ 目录给它。然后说。

请阅读 AGENTS.md 了解规则。然后阅读 raw/ 目录下的所有资料。按照规则为每份资料生成 wiki 页面。更新 index.md 和 log.md。

然后等它干完。

第一次 ingest 的完整流程是这样的。

干完之后，打开 wiki/ 目录看看。

你应该能看到几个新文件。每个文件对应一份原始资料的摘要。index.md 里列出了所有页面。log.md 里记录了这次操作。

如果 AI 没有按规则来，检查一下 AGENTS.md 写得够不够清楚。大多数时候问题出在规则不够具体。

第五步：问一个跨资料的问题

这一步很关键。不要只问「帮我总结第一篇文章」。那和普通的 AI 对话没区别。

要问一个需要综合多份资料才能回答的问题。

比如我放了3篇 AI Agent 的文章。我问的是。

根据 wiki 里的内容，目前 AI Agent 的主要架构模式有哪几种？各自的优缺点是什么？

AI 会去 wiki/ 里找相关页面，综合出一个回答。

这个回答本身就是新的知识。

第六步：把回答写回 wiki

这是整个流程里最容易被忘掉的一步。也是最重要的一步。

告诉 AI。

刚才的回答很有价值。请按照 AGENTS.md 的回写规则，把这个结论写成一页新的 wiki 页面。更新 index.md 和 log.md。

这就是 Karpathy 说的 file back。回答不再消失在聊天记录里。它变成了 wiki 的一部分。

下次你再问相关的问题，AI 已经知道这个结论了。不用重新推导。

这就是「用完不忘」。

第七步：检查一遍

AI 写的东西不一定全对。

打开 wiki/ 目录。逐页看一遍。

检查几件事。

来源标注对不对。有没有写了结论但没标来源的。有没有页面之间的链接是断的。有没有明显的错误或过时的信息。

Karpathy 在 gist[2] 里说过一句话。Human owns verification。AI 可以维护 wiki。但最终验证的责任在你。

这一步不能省。

日常使用：循环起来

搭完之后，日常使用就是不断重复这个循环。

每转一圈，wiki 就厚一点。AI 知道的就多一点。回答就准一点。

这是一个正循环。用得越多越好用。

两个核心文件怎么写

index.md 和 log.md 是 wiki 的骨架。给你看看我的长什么样。

index.md 示例。

# Wiki 索引## AI Agent- [[summary-agent-survey]] AI Agent 综述论文摘要- [[summary-react-pattern]] ReAct 模式详解- [[concept-tool-use]] 概念：工具调用- [[compare-agent架构模式]] 对比：三种主流 Agent 架构## 知识管理- [[summary-llm-wiki]] Karpathy LLM Wiki 思路摘要- [[concept-file-back]] 概念：回写机制最后更新：2026-04-08

log.md 示例。

# 操作日志## 2026-04-08- [ingest] 导入 raw/agent-survey.pdf，生成 summary-agent-survey.md- [ingest] 导入 raw/react-paper.md，生成 summary-react-pattern.md- [query] 用户提问「Agent 架构模式对比」，生成 compare-agent架构模式.md- [file-back] 将对比结论写回 wiki- [lint] 检查完毕，无断链

一个管空间。一个管时间。Karpathy 说在大约100篇资料、40万词的规模下，靠这两个文件就能导航整个知识库。不一定需要复杂的 RAG 基础设施。

但前提是你的 wiki 是有结构的。不是一堆散乱的文件。

进阶：让 wiki 为你的 Agent 工作

搭到这一步，wiki 已经能帮你记住东西了。

但还可以更进一步。

Farzapedia[3] 的作者 Farza 说了一句话。这个 wiki 不是为我建的。而是为我的 Agent 建的。

什么意思。

他把自己的日记、笔记、聊天记录都喂进了 wiki。生成了400篇互相链接的个人百科。当他让 Agent 帮他做一个新产品的 landing page 时，Agent 会自动去 wiki 里找他历史上喜欢的设计风格、竞品分析、审美偏好。

做出来的东西不再是通用的。而是「他的」。

想了想。这个思路挺妙的。

你往 wiki 里沉淀的不只是知识。还有你的判断、你的偏好、你的经验。AI 读了之后，它的输出就带上了你的印记。

wiki 不只是记忆。是你的 Agent 的工作底稿。

容易踩的坑

搭的过程中我踩了几个坑。提前说一下。

第一个坑。AGENTS.md 写得太模糊。

比如只写了「生成摘要」，没说摘要多长、什么格式、要不要标来源。AI 每次生成的东西都不一样。后来我把格式要求写得很具体，问题就解决了。

第二个坑。不做 file back。

问完就走了。回答消失在聊天记录里。下次又得重新问。这是最常见的问题。解决办法是在 AGENTS.md 里写死回写规则。每次回答后必须检查有没有值得写回的内容。

第三个坑。从不检查。

AI 写的东西不一定对。尤其是跨资料综合的结论，可能有张冠李戴的情况。社区评论区[4]里有人建议每种实体类型一个模板，给索引设 token 预算。这些都是实战中总结出来的。

第四个坑。一上来就喂太多资料。

先用3到5份资料跑通整个流程。确认 AGENTS.md 的规则好使了，再慢慢扩大。

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～