当前位置: 首页 > news >正文

RAG应用的八种技术架构

RAG(Retrieval-Augmented Generation,检索增强生成)是一种通过整合外部知识检索来增强大语言模型(LLM)能力的技术,简而言之就是给LLM加了知识外挂,这个知识外挂可以是传统关系型数据库、向量数据库或图数据库。RAG的另外一个核心内容是提示词模板Prompt Template,最终是要将检索到的知识结合提示词一起发送给LLM来增强生成。

那么为什么需要RAG,因为大语言模型有几个现实问题:

  1. 受训练资料时间的影响,它的知识能力停止资料截止的时间,也就是说无法获取最新的知识;
  2. 对于无法回答的问题大语言模型会一本正经的胡说八道,俗称“幻觉”;
  3. 对于一些较专业的场景,如医疗、法律等比较严谨的领域,大语言模型只是一般性知识的回答,无法应对专业问题,微调的成本太高。

总结来说就是知识截止时间和专业领域知识欠缺。

RAG使用外部知识来增强LLM的能力,知识库可以做到数据的实时更新,针对特定领域,构建对应的知识库,相比较模型微调,大大降低了开发成本,只需要用通用的LLM对接知识库。

先不聊特别深入的话题,我们就用大白话,聊聊RAG的几种架构,这些架构既是AI时代的不断探索,也是针对不同场景的选择,总有一款适合你。

▍一、Naive RAG 基础RAG

基础RAG是最简单的RAG架构,一般做快速验证可以使用,流程比较清晰:

用户查询->查询内容嵌入->检索知识库->LLM生成返回

▍二、Multimodal RAG 多模态RAG

多模态RAG和Naive RAG流程相同,唯一的不同是数据源使用了多类型数据,如音视频、文本等。它的好处是对于支持多模态的模型来说,可以查询图片或者视频。

▍三、Graph RAG 图RAG

前面提到知识库可以是关系型数据库,也可以是图数据库。图数据库是以实体为节点,关联关系为边,能沿着关系链遍历,从而天然具备可解释性且推理路径可视化,精准找到长链问题的答案,Graph RAG就是通过知识图谱增强检索知识的能力,适用于合规、医疗等强监管场景。

▍四、Corrective RAG 纠正式RAG

Corrective RAG是在查询分析之前加入了查询分析以及网络搜索模块,例如通过查询分析对query进行改写再检索向量库,利用web检索可置信内容等。目的就是为了进一步提高检索准确度,降低幻觉。适用于企业知识库、开放领域问答等。

质检->修正->网络兜底

▍五、HyDE 假设文档嵌入

HyDE(Hypothetical Document Embeddings)假设文档嵌入顾名思义是用假设性的文档来改进LLM生成答案的方法。它的做法很简单,就是先用LLM生成假设性的答案,然后再将假设性答案嵌入查询,那么嵌入查询就有可能查询到更可靠的答案。相当于用答案来搜索答案,有点达文西的感觉了!它的目的是捕捉问题隐藏的意图,丰富查询语句,解决查询语句细节不充分的搜索。

▍六、Hybrid RAG 混合RAG

Hybrid RAG是混合多种数据库进行查询的技术,解决单一数据库的劣势,列入结合图数据库和向量数据量,充分利用它们的优势,提升检索能力。

▍七、Adaptive RAG 自适应RAG

Adaptive RAG体现在“自适应”上,核心是动态路由和策略自适应,根据问题复杂程度,动态选择检索路径,对于简单问题直接LLM回答,复杂问题多步迭代,提升检索效率,降低成本。有点“看人下菜碟”的意思。适用于智能客服场景。

▍八、Agentic RAG 代理式RAG

Agentic RAG引入代理的概念,使用AI智能体协同工作,自主查询,面对复杂任务也是游刃有余。因为智能体能拥有记忆组件、规划以及调用工具的能力,那么在检索式就能利用LLM的推理能力自主规划查询步骤,解决了传统RAG固定流水线的问题。例如多智能体可以实现一个智能体查询邮件、一个智能体查询数据库,一个智能体查询网络,显著增加了检索内容以及效率,但同时带来的问题是成本也会提高。

▍🤗总结

以上的八种RAG架构各有千秋,智能的不一定是最好的,简单的未必是最差的,根据自己的所需场景选择才是最重要的!

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

http://www.jsqmd.com/news/1003316/

相关文章:

  • linux:命名管道与共享内存
  • 2026年四川交通杆件行业口碑观察:哪些企业值得关注? - 优质品牌商家
  • Monk AI:Kaggle竞赛端到端快速启动工具链
  • 从‘报不准’到‘更靠谱’:聊聊数值降雨预报偏差校正的常见误区与实战选择(LS vs QM)
  • 解密高效Garry‘s Mod模组发布神器:gmpublisher一站式解决方案完全指南
  • Chainer-fast-neuralstyle与深度学习:理解感知损失在风格迁移中的作用
  • VB.NET 2010 可直接运行的TCP双向通信演示(含客户端+服务端完整工程)
  • 告别单调报表!用ABAP ALV颜色打造智能数据看板:条件格式化与业务逻辑结合
  • 告别Vuex!在uni-app里用Pinia管理状态,这份配置指南和两种写法对比请收好
  • 2026年华北传动配件行业观察:齿轮、链轮、齿条厂商如何选?——基于京津冀鲁晋五地产能与技术对比分析 - 优质品牌商家
  • VC6 MFC实现的空圆准则Delaunay三角剖分工具(含DEM可视化)
  • MLOps工程实践:构建可复现、可监控、可协作的机器学习生产流水线
  • GPS信号模拟器架构解析与高性能SDR实现指南
  • 项目实训开发日志(三)
  • TransCad交通分布预测第一步:如何正确导入OD矩阵Excel文件(避坑ID匹配问题)
  • reasonix的安装与使用
  • 潜水砌墙公司电话,口碑好的尚基建设工程专业 - mypinpai
  • 机器学习模型生产化落地:从Notebook到稳定服务的实战闭环
  • 终极解放!淘宝自动化任务神器:taojinbi脚本让你的日常任务全自动完成
  • 手把手教你用QLoRA在单张消费级显卡上微调65B大模型(附Colab实战代码)
  • 别再手动重启了!C# NModbus4 TCP通讯的自动重连保姆级配置(附心跳检测代码)
  • GitHub加速插件终极指南:3分钟解决国内访问GitHub龟速问题
  • TensorFlow 2.x端到端实战:从数据加载到生产部署
  • 智能剧情管家:让《绝区零》的对话不再成为负担
  • 手把手教你用HFSS/CST仿真:从方向图函数到天线增益的完整计算流程
  • ThinkPad风扇控制终极指南:TPFanCtrl2高效配置与实用技巧
  • C#调用金橙子MarkEzd.dll实现激光打标控制的完整工程示例(EzCad2.7.0_UNICODE)
  • 终极暗黑2存档编辑器完整指南:3分钟学会免费修改你的角色存档
  • 计算机毕业设计之基于协同过滤算法的招聘信息推荐系统
  • 软件开发中结构化方法与面向对象方法在软件生命周期中的对应关系