当前位置：首页 > news >正文

3分钟学习大模型（LLM）基础 - | 大模型检索增强生成（RAG）

news 2026/3/27 1:36:49

在使用 Deepseek、ChatGPT 等大模型时，你是否遇到过这样的情况：问它今天最新的新闻，它回答“我的知识截止于2023年”；或者问它关于你公司内部的考勤制度，它开始一本正经地编造规则。

这是因为大模型的知识是“预训练”好的，一旦训练完成，它的知识库就固定了。要想让大模型既懂最新的时事，又懂你私有的知识，就需要用到一种关键技术——检索增强生成（RAG）。本文将用通俗易懂的语言，讲解RAG的含义、重要性及使用方法。

1. 什么是 RAG（检索增强生成）

我在3分钟学习大模型（LLM）基础 - 1 | 大语言模型是什么文中提到“大模型（LLM）的本质是一个庞大的数学公式” 。这个公式虽然看过万亿级的数据，但它就像一个参加“闭卷考试”的学生，只能凭记忆（训练数据）答题。

而RAG（Retrieval-Augmented Generation，即检索增强生成）就是允许这个学生在考试时“开卷翻书”。具体而言，当大模型遇到不懂的问题时，RAG 技术会先去查找外部的数据库/互联网的相关资料，把资料和大模型原本的知识结合起来，之后再回答用户的问题。

由此，我们可以总结出 RAG 的本质：

💡 核心：大模型 + 外挂知识库
🔧 功能：让大模型利用外部实时或私有数据生成答案。

2. RAG的重要性

既然大模型已经看过互联网上大部分的文本，为什么还需要给它“外挂”一个知识库呢？主要为了解决以下三个“顽疾”：

🧠 减少大模型的“幻觉”

我在3分钟学习大模型（LLM）基础 - 3 | 大模型的幻觉文中强调“幻觉是大模型为了维持‘概率上的通顺’而进行的合理化虚构”。当大模型不知道答案时，它会为了维持语句的通顺而忽视回答内容的真实性。而有了 RAG，大模型必须基于检索到的真实资料回答，从而大幅降低胡说八道的概率。

💰 经济高效的“补课”

大模型的训练成本极高。如果为了让 AI 知道“今天的天气”或“公司新发的通知”而每天重新训练模型，在经济上是不现实的。 RAG 相当于不需要给大脑做手术，只需要递给它一本新书。数据更新，只需更新外挂的知识库，无需改动大模型本身，从而降低大模型的训练成本。

🔒 数据隐私的保护

出于对数据隐私保护的考虑，很多企业不敢把内部文档（如合同、代码）投喂给公有大模型进行训练。使用 RAG，企业的数据可以保存在本地的“外挂库”中，大模型只是在回答问题时临时读取，企业机密数据不会被大模型开发公司拿走。

3. RAG的工作原理

了解了原理，我们再来看看 RAG 的具体运行流程。虽然技术细节很复杂，但逻辑上可以划分为三个步骤：

检索（Retrieval）：当你提出问题（例如“我们公司的差旅报销标准是什么？”），系统不会直接问大模型，而是先去你的企业知识库里“搜索”，找到了《2026年员工差旅管理办法.pdf》中的相关段落。
增强（Augmentation）：系统把你的问题和刚才找到的“报销标准段落”拼接在一起，形成一个新的、更长的提示词。
生成（Generation）：系统把这个包含答案线索的提示词扔给大模型。此时大模型不再是瞎猜，而是阅读了参考资料后，为你总结出答案。

⚠️ RAG 的局限性

虽然 RAG 很好用，但它也受到3分钟学习大模型（LLM）基础 - 4 | 大模型的上下文窗口（Context）中的上下文窗口限制。如果检索到的资料太多（例如搜出了几十本书的内容），超过了模型的上下文窗口上限，大模型依然会“消化不良”或丢失信息。

因此，进行涉及大规模资料检索的相关任务时，需“定期总结”资料的要点，把长篇大论浓缩成精华。

想入门 AI 大模型却找不到清晰方向？备考大厂 AI 岗还在四处搜集零散资料？别再浪费时间啦！2026 年AI 大模型全套学习资料已整理完毕，从学习路线到面试真题，从工具教程到行业报告，一站式覆盖你的所有需求，现在全部免费分享！

👇👇扫码免费领取全部内容👇👇