当前位置: 首页 > news >正文

RAG相关概念梳理

一、构成RAG的基本概念

Embeddings:用数学空间表达语义和文本间的关系

文本相似度: 表层:词汇重叠.深层:语义

语义相似度与距离:关注文本的深层含义与上下文,而非仅仅是词汇。

语义距离:越近,语义相似度越高;越远,语义相似度越低.

文档分块(chunking):将长文本按一定大小和分块策略拆分成小块进行存储。分块策略很重要,一般会按章节、段落、句子进行分块。固定字符分割器和递归字符分割器比较常用,语义分割器和LLM分割器也需要了解。对于结构化文档,或者专注于某一个领域的文档,可以自定义文档结构分割器。

向量数据库: 文本转化成高维向量,存入向量数据库。向量数据库的检索是语义检索,而传统Bm25算法是基于关键词搜索,不理解语义。

主流向量数据库Pineane、Weaviate、ChromaDB、Milyus、Qdrant等
常用RAG检索方案:混合检索,结合BM25和语义检索的优势(结合项目思考:为什么?)
底层检索机制FAISS、ScaNN等库
高效算法HNSW等

 

二、RAG的挑战

 

1、答案分布在多个块或文档中,难以获取完整上下文,导致信息不准确/不完整

 

2、系统效果高度依赖分块和检索质量

 

3、如何处理矛盾信息

 

4、定期维护需要成本

 

三、知识图谱RAG与智能体RAG

RAG(GraphRAG):利用知识图谱而非简单向量数据库进行储存知识并检索,能整合分散在多个文档的信息,弥补传统RAG的不足,同时,知识图谱的构建方式能让检索结果理解数据间的连接,能提供更具上下文和细致度的答案。

缺点:构建和维护高质量知识图谱的复杂性高,每次构造图调用LLM成本高,延迟高

特点:“有深度,能洞察到数据潜在关联性”

智能体RAG:引入推理和决策层.专门的Agent主动参与,来把关知识质量,精炼知识。

优势:

①能够进行反思和来源验证

②调和知识中的矛盾和冲突,比如两份知识块内容有矛盾,智能体RAG可以判断哪份更为可信

③可以进行多步推理,给出一个结构化的综合了多方复杂因素的答案

④能识别知识空缺并调用外部工具

挑战:

①设计、实现和维护需要大量工程投入,计算开销也更高。

②延迟,耗时更高

③智能体本身带来的错误,如推理失误陷入无用循环、误解任务,或错误地丢弃了相关信息,影响响应质量。

 

四、思考与回答

1、什么是知识图谱?原理?实现?

知识图谱是一些形如:“主体-关系一主体”、“主体一属性“属性值”的三元组通过主体关联起来的一张网络图,主体、关系和属性组成了知识图谱的数据层,而另有“模式层”定义主体和属性、关系都包含哪些现实概念。
知识图谱RAG是先G-Indexing:通过Lm提取三元组,建立图谱,存入图数据库/三元组库/关系型数据库;

再通过G-Retrivaling 检索主体与关联的边、主体、属性等,或提取主体聚合成社区的特征。

最后进行G-Generating,将结果(子图或社区摘要)线性化为自然语言文本,完成RAG。

2.RAG Agont的推理和决策,是在一次api请求内完成的,还是反复整合输出调整输入,进行多次请求?

RAG Agent是使用langGraph这种编排层框架,通过多次,序列化地调用LLm和各类工具(检索器,API等),组织起一个“规划一执行一观察一反思”的循环工作流。在这个过程中,LLm主要扮演“规划者”和“判断者”的角色,而系统的“行动能力”则由编排层调度外部资源完成。

推理-决策与模型内“深度思考”的区别:深度思考是模型内生能力。其核心是通过改进模型架构或训练方法(如CoT思维链数据微调),让模型在“单次前向传播”中,生成更连贯,更“有逻辑”的推理步骤。推理-决策是外部的工程编排,二者是“更锋利的剑”与“更好的剑法”的关系。

3. RAG底层检索机制?

在向量数据库中存在着超大量级的向量,在针对query向量进行相似度对比时,如果暴力一个一个对比,消耗的时间是不可估计的。HNSW之类的算法提供了更好的搜索方式(我暂时不知道是什么,应该是增加索引一类的),而FAISS、ScaNN就是这种算法的集合工具库,但是向量存在哪里工具库不管。Pinecone、Weaviate是向量数据库,同时集成了搜索工具库,直接可以使用。

 

http://www.jsqmd.com/news/49594/

相关文章:

  • gtags
  • 欧姆定律是个啥?
  • 抖音投流健康领域领航者——苏州诊途赋能品牌全域增长 - langchain
  • Windows后门排查_2025/11/24(持续更新)
  • 2025年11月江苏徐州系统门窗隔热条、江苏门窗隔热条、国标隔热条、隔热条、定制隔热产品厂家综合推荐指南
  • 188. 买卖股票的最佳时机 IV -- DP问题如何确定dp数组的含义以及状态转移方程?
  • 博客园真不错
  • MAF快速入门(2)Agent的花样玩法
  • 效率与安全的双引擎:聚焦合同管理中的印章文识别技术
  • re笔记1
  • 海外求职必备:多语言AI简历工具如何助力求职外企和跨国公司
  • MATLAB/Simulink水箱水位控制系统实现
  • AI语言大模型支持下的:SCI论文从设计到发表的全流技巧(选题、文献调研、实验设计、数据分析、论文结构及语言规范) - 教程
  • Ai元人文:前言
  • Oracle ASM存储维护实践与规范指南
  • 新露谷物语-新手指南:
  • 从 runC 到 runD:SAE 如何用 “装甲级” 隔离,化解运维安全焦虑!
  • 实用指南:SAP MM 采购申请转采购订单功能分享
  • ddddocr: 滑块验证码的一个例子
  • 恢复Windows图片查看器
  • 没有root权限在linux安装python库
  • 2025白酒品牌推荐:聚会必备气氛担当,7 款让酒桌升温的纯粮好酒
  • linux之基于信号解决僵尸进程的写法
  • 《ESP32-S3使用指南—IDF版 V1.6》第五十章 WiFi热点实验
  • 各位大哥好
  • 【无标题】HIT-ICS2025计统大作业——程序人生 - 详解
  • mapvthree Engine 设计分析——二三维一体化的架构设计
  • eMMC, UFS,SATA,PCIe/NVMe
  • 2025 十大充电桩品牌推荐:全场景覆盖 + 硬核产品,这些厂家领跑行业
  • 2025年一对一家教老师实力排行权威发布,上门家教/一对一家教一对一家教老师推荐榜单