当前位置: 首页 > news >正文

作为后端开发你不得不知的 AI 知识——RAG

作为后端开发你不得不知的 AI 知识——RAG

前言

我们知道,大模型的知识都是固化的,它不认识你公司的最新产品,而 RAG 就是为模型提供知识库的一种有效方法。

基于RAG(Retrieval Augmented Generation,检索增强生成)构建知识库,是大模型兴起之后最快被采纳接收的架构范式之一。当前,RAG 系统已经被广泛地应用在客服问答、个性化推荐、智能对话助手等场景中。RAG 技术能够弥补大模型因知识截止而无法获取最新信息的问题,并有效降低其产生幻觉的风险,而且 RAG 技术相比于大模型后训练或微调方式,以更加成本低的方式与企业的专有数据对接,以实现大模型快速技术验证和商业化尝试。

RAG 知识库的应用架构

基于 RAG 构建知识库的应用架构如下。可以简单划分为离线索引建构在线检索和生成过程

  • 离线向量过程通过把用户上传的文档进行文档智能解析、切片,再进行向量化存储到向量数据库。
  • 在线过程则把用户的请求问题向量化之后与向量库中的切片向量进行相似度比对,慈悲个人召回最接近用户问题的相关切片。

如今构建上图这样的 RAG 系统已经变得非常简单,开源社区和商业产品都提供了非常简便的构建方式。在满足复杂的业务需求的过程中,通常一个简单的 RAG 系统无法满足业务需求,会遭遇准确率和召回率的挑战、信息冗余噪声导致的模型幻觉、知识库庞杂难以管理等问题。当前 RAG 系统的构建也逐步向模块化、Agentic RAG 的高级架构演进。

从离线过程来看,文档解析技术除了经典的 OCR 和电子解析技术,也在利用大模型进行更准确的文档解析,比如对于图片类的文档,通过 VLM 视觉 理解大模型,能够对这类文档进行更全面的文档理解。

从在线检索过程来看,检索前、检索中、检索后过程里,都发展出很多的技术手段来加强和管理整体 RAG 的效果。

如:

  • 检索前可以增加 Query 改写、知识库路由等模块
  • 检索过程可以采用混合检索策略
  • 检索后可以增加充排序、拒识模块等。

从构建包含 RAG 的 AI 应用来看,Agentic RAG 成为新的趋势之一,用户将知识库检索作为大模型的工具之一,由大模型来决定是否以及何时进行检索以获取必要的知识库信息。另外,多模态 RAG 技术也是当前蓬勃发展的领域,随着多模态理解大模型能力的增强,多模态 Embedding 向量模型也取得了重大的发展。基于多模态向量模型的 RAG 系统在商品搜推、视频创作等各类场景已经获得了规模化的落地。

RAG 知识库的应用场景

知识库落地有广泛的应用场景,包括客服服务、个性化推荐、AI 陪伴、内容创作等。其中客服服务 RAG 是最广泛落地的应用之一,从业务特征来看,通常需要大量的业务背景知识,并且这些知识是不断更新的,例如常见问题解答(FAQ)、产品规格、故障排除指南以及公司政策等。

在这些场景里,知识库是严格知识的来源、可信任,作为降低大模型幻觉的重要手段。甚至在更加严肃的场景里,许多用户将大模型只作为知识库的整理工具,要求大模型回答需要严格遵循知识库里的知识,不能随意发挥,以避免严重的客诉问题。

不过当前 RAG 的应用也已经超越简单的回答。基于 RAG 的系统,叠加大模型分析客户对话数据等能力,能够帮助企业优化服务策略和挖掘销售线索等。RAG 的价值正在从解决幻觉这一技术问题,向赋能业务的更高层面演进。多模态 RAG 的兴起,将 RAG 的应用边界从纯粹的知识问答推向了更广阔的领域:

  1. 零售电商场景:用户 可以通过上传图片来检索商品,从而实现商品图搜和个性化推荐。
  2. 媒体娱乐领域:多模态 RAG 也帮助从海量音频视频内容中检索出特定的片段,从而服务于音视频内容分发以及新型的 AI 视频创作场景。

RAG 知识库的未来发展

大模型发展至今,RAG 作为最成熟的 AI 应用架构之一,尽管基础 RAG 的实现已趋于成熟,但仍有人认为其技术含量不高。然而,我们观察到,构建一个真正满足复杂业务需求的高级 RAG 系统仍然充满挑战,并且该领域正在不断演进。比如在当前 Advanced RAG 架构里,仍然有许多技术问题待解决。多模态 RAG 相关的技术,也在快速地发展当中,其应用场景和想象力空间更大。

无论未来 LLM 架构如何演变,只要它们仍然依赖外部知识来增强其能力,向量检索作为一种高效、语义化的上下文获取机制,仍然将发挥重要的价值。

http://www.jsqmd.com/news/351394/

相关文章:

  • 【SRC】SQL注入快速判定与应对策略(一)
  • 【CTFshow-pwn系列】03_栈溢出【pwn 041】详解:32位 ROP 与字符串搜索
  • CANN AIGC文生图轻量推理:批量推理任务调度插件开发
  • 【5G通信】5G毫米波UDN中带有定位感知波束成形的系统级干涉评估模型附Matlab代码
  • CANN异构计算架构赋能AIGC:从模型推理到内容解析实战
  • 组合计数大学习
  • 宏智树AI封神!课程论文不用熬,新手速通高分作业秘籍
  • 中文的全息之美:字音藏道,字里见宇宙
  • 26年湛江一中高一期末考试第19题 函数新定义问题
  • Excel财务实战:零钞估算备用表制作全攻略
  • ai应用工具豆包
  • Ubuntu学习笔记 - 详解
  • Python毕设项目推荐-基于Django的在线考试与评估系统设计与实现题库管理、智能组卷、在线作答、自动阅卷及成绩分析【附源码+文档,调试定制服务】
  • 深入理解Prompt、Skills、Projects、MCP:掌握AI工作的完整逻辑,让AI成为你的得力助手
  • 飞凌嵌入式ELF-RV1126B-远程使用配置
  • Python毕设项目推荐-基于python的租房管理系统的设计与实现房源管理、租客匹配、电子合同签署及租后维护功能【附源码+文档,调试定制服务】
  • 宏智树AI太懂论文党!零基础搞定数据分析,图表规范盲审一次过
  • 宏智树 AI:告别问卷设计雷区!从无效提问到专业量表,一篇教你搞定实证调研
  • 程序员必看!大模型热门岗位全解析+系统学习指南,收藏这篇就够了:岗位需求图谱与技能迁移方案
  • win11共享文件夹
  • 如何用影刀RPA实现"PSD模板自动套图",将多张本地素材图填充至预设的排版"坑位"中? | 电商详情页排版自动化实战思路
  • 告别“色盲“检索!PageIndex让AI像专家一样阅读文档,准确率高达98.7%
  • 豆瓣电影数据采集分析推荐系统 | Python Vue Flask LSTM Echarts 多维度分析人工智能 大数据 毕业设计源码
  • 【状态估计】基于卡尔曼过滤器进行阻抗测量的无传感器电池内部温度估计附matlab代码
  • IPC与RPC通信构建方式
  • 算法系列之 基于Linux Alsa的AVAS实现
  • 【课程设计/毕业设计】python租房网站基于python的租房管理系统的设计与实现房屋信息、租赁合同、预约看房、退房登记【附源码、数据库、万字文档】
  • Python毕设项目:基于Django的在线考试与评估系统设计与实现(源码+文档,讲解、调试运行,定制等)
  • 【数据分析】辅导功能和ISSR-MDF模型的综合预警指标附Matlab代码
  • Unity空Update性能陷阱揭秘