当前位置：首页 > news >正文

RAG大揭秘：8种架构解锁AI知识库新玩法，轻松提升大模型能力！

news 2026/6/16 0:37:23

RAG(Retrieval-Augmented Generation，检索增强生成)是一种通过整合外部知识检索来增强大语言模型（LLM）能力的技术，简而言之就是给LLM加了知识外挂，这个知识外挂可以是传统关系型数据库、向量数据库或图数据库。RAG的另外一个核心内容是提示词模板Prompt Template，最终是要将检索到的知识结合提示词一起发送给LLM来增强生成。

那么为什么需要RAG，因为大语言模型有几个现实问题：

受训练资料时间的影响，它的知识能力停止资料截止的时间，也就是说无法获取最新的知识；
对于无法回答的问题大语言模型会一本正经的胡说八道，俗称“幻觉”；
对于一些较专业的场景，如医疗、法律等比较严谨的领域，大语言模型只是一般性知识的回答，无法应对专业问题，微调的成本太高。

总结来说就是知识截止时间和专业领域知识欠缺。

RAG使用外部知识来增强LLM的能力，知识库可以做到数据的实时更新，针对特定领域，构建对应的知识库，相比较模型微调，大大降低了开发成本，只需要用通用的LLM对接知识库。

先不聊特别深入的话题，我们就用大白话，聊聊RAG的几种架构，这些架构既是AI时代的不断探索，也是针对不同场景的选择，总有一款适合你。

▍一、Naive RAG 基础RAG

基础RAG是最简单的RAG架构，一般做快速验证可以使用，流程比较清晰：

用户查询->查询内容嵌入->检索知识库->LLM生成返回

▍二、Multimodal RAG 多模态RAG

多模态RAG和Naive RAG流程相同，唯一的不同是数据源使用了多类型数据，如音视频、文本等。它的好处是对于支持多模态的模型来说，可以查询图片或者视频。

▍三、Graph RAG 图RAG

前面提到知识库可以是关系型数据库，也可以是图数据库。图数据库是以实体为节点，关联关系为边，能沿着关系链遍历，从而天然具备可解释性且推理路径可视化，精准找到长链问题的答案，Graph RAG就是通过知识图谱增强检索知识的能力，适用于合规、医疗等强监管场景。

▍四、Corrective RAG 纠正式RAG

Corrective RAG是在查询分析之前加入了查询分析以及网络搜索模块，例如通过查询分析对query进行改写再检索向量库，利用web检索可置信内容等。目的就是为了进一步提高检索准确度，降低幻觉。适用于企业知识库、开放领域问答等。

质检->修正->网络兜底

▍五、HyDE 假设文档嵌入

HyDE（Hypothetical Document Embeddings）假设文档嵌入顾名思义是用假设性的文档来改进LLM生成答案的方法。它的做法很简单，就是先用LLM生成假设性的答案，然后再将假设性答案嵌入查询，那么嵌入查询就有可能查询到更可靠的答案。相当于用答案来搜索答案，有点达文西的感觉了！它的目的是捕捉问题隐藏的意图，丰富查询语句，解决查询语句细节不充分的搜索。

▍六、Hybrid RAG 混合RAG

Hybrid RAG是混合多种数据库进行查询的技术，解决单一数据库的劣势，列入结合图数据库和向量数据量，充分利用它们的优势，提升检索能力。

▍七、Adaptive RAG 自适应RAG

Adaptive RAG体现在“自适应”上，核心是动态路由和策略自适应，根据问题复杂程度，动态选择检索路径，对于简单问题直接LLM回答，复杂问题多步迭代，提升检索效率，降低成本。有点“看人下菜碟”的意思。适用于智能客服场景。

▍八、Agentic RAG 代理式RAG

Agentic RAG引入代理的概念，使用AI智能体协同工作，自主查询，面对复杂任务也是游刃有余。因为智能体能拥有记忆组件、规划以及调用工具的能力，那么在检索式就能利用LLM的推理能力自主规划查询步骤，解决了传统RAG固定流水线的问题。例如多智能体可以实现一个智能体查询邮件、一个智能体查询数据库，一个智能体查询网络，显著增加了检索内容以及效率，但同时带来的问题是成本也会提高。

▍🤗总结

以上的八种RAG架构各有千秋，智能的不一定是最好的，简单的未必是最差的，根据自己的所需场景选择才是最重要的！