当前位置: 首页 > news >正文

M-RAG:让你的RAG更快、更强、更高效

Retrieval-Augmented Generation (RAG) 通过引入外部知识缓解了大语言模型(LLM)的知识局限和幻觉问题,已成为提升模型可靠性的主流范式。然而,传统RAG系统严重依赖**文本分块(Text Chunking)**策略来构建检索单元,这带来了固有的结构性缺陷。

Figure 1: 分块导致的信息碎片化和结构丢失

如图1所示,分块过程如同用剪刀裁剪文档,会打断原始文档的语义链(Semantic Chains),导致三种关键问题:**信息碎片化(Fragmentation)**破坏了语义连贯性;**噪声引入(Noise Introduction)**增加了无关内容;**全局上下文丢失(Loss of Global Context)**削弱了文档级推理能力。

虽然长上下文LLM的出现让"直接处理完整文档"成为可能,但这并不能解决相关性过滤证据优先排序的核心需求。为此,本文提出M-RAG,一种无分块(CHUNK-FREE)的检索新范式。

方案:键值解耦的元标记检索

Figure 2: M-RAG整体架构

M-RAG的核心创新在于键值解耦(K-V Decomposition)设计。如图2所示,系统首先通过Marker Extractor从完整文档中提取结构化的元标记(Meta-markers),每个标记 被显式分解为两个互补组件:

  • 检索键(k):轻量级语义锚点(约19-20 tokens),针对查询意图优化,作为高效的"锚点"用于相似度匹配
  • 信息值(v):上下文丰富的内容块(约50-65 tokens),保留完整的事实关系用于生成

Table 1展示了标记提取的Prompt设计原则。系统要求LLM生成细粒度的标记,每个标记严格覆盖1-3个段落(优选1-2个),并通过段落重叠确保完整覆盖。提取过程采用零样本或少样本提示,无需任务特定训练。

组件设计要求
k (检索键)生成一个详细问题,既总结内容又作为检索查询,包含关键实体和概念
v (信息值)200-300字自包含段落,聚焦单一事实,消除代词歧义,绑定具体属性
paragraph_indices最多3个段落索引(0-2个为最佳),必须重复使用段落以确保全覆盖

检索阶段,系统仅在轻量级的k上进行相似度计算(采用HNSW算法),再根据token预算动态选取对应的v进行生成。这种设计实现了检索效率生成质量的彻底解耦:查询匹配在紧凑的语义空间完成,而生成仍能获得完整的上下文支持。

效率与效果的双重提升

实验在LongBench的NarrativeQA、Qasper和2WikiMultihopQA任务上进行。如Table 2所示,M-RAG在低token预算(128×1)下表现尤为突出,在Qasper任务上相比Fixed-Size、Semantic和PIC基线分别提升**37.2%**、**9.2%14.2%**,证明了在资源受限场景下的优势。

如图4所示,M-RAG的平均检索延迟显著低于基于分块的方法(在Qasper上仅需214ms,而Semantic需要226ms,PIC需要331ms)。这是因为相似度计算仅在轻量级的k上进行,避免了长文本块的嵌入计算开销。

Figure 4: 检索时间对比

进一步分析表明,M-RAG实现了**99.8%**以上的文档覆盖率,且k与v的token长度比稳定在1:2.5至1:3之间。这种稳定的解耦结构使M-RAG成为传统分块RAG的可扩展、鲁棒替代方案,为长上下文环境下的知识检索提供了新的设计思路。

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

http://www.jsqmd.com/news/595611/

相关文章:

  • 从零构建视觉导航机器人:ROS+OpenCV+Qt的模块化开发与A*算法实战(附完整代码)
  • 保姆级指南:用FireRedASR-AED-L将会议录音秒变文字稿
  • 前后端分离网站系统|SpringBoot+Vue+MyBatis+MySQL完整源码+部署教程
  • 基于AFL的覆盖引导模糊测试优化技术研究(论文)
  • Fluent结果.dat文件打不开?手把手教你用PyFluent正确读取cas.h5进行后处理
  • 【算法精解】CEC2021竞赛亚军算法-MadDE框架及代码实现(Matlab)
  • 【从0开始学设计模式-6| 原型模式】
  • Swagger Client 完整教程:从零开始构建强大的 API 集成应用
  • 文件上传漏洞的花式绕过:用Pikachu靶场复现企业级攻防场景
  • Sony FCB-EV9500L LVDS图像闪烁问题分析
  • STM32F469NI+LVGL双缓冲与DMA2D硬件加速实战
  • 网站SEO关键词对网页排名的重要性如何评估
  • Kandinsky-5.0-I2V-Lite-5s应用场景:游戏NPC立绘动态化+过场动画快速生成
  • 手机生成剧本杀软件2025推荐,创新剧情设计工具助力创作
  • SDMatte算法原理浅析:从卷积神经网络看图像分割技术
  • 5分钟部署Fun-ASR语音识别:支持中文、英文、日文等31种语言
  • Java企业级集成:Qwen3-ASR-0.6B语音质检系统开发
  • 融合LoRA微调模型:打造专属领域的AI修图专家系统
  • 自动驾驶中的ICP:激光SLAM定位模块是如何用点云匹配实现厘米级精度的?
  • SEO_为什么你的SEO策略无效?常见原因与解决办法(372 )
  • 伏羲天气预报可信AI:预报结果置信度输出、不确定性传播与可视化
  • 从read()到硬盘:用strace和bpftrace动态追踪Linux内核文件读取的完整路径(附实战脚本)
  • 编写程序实现智能乐器音准检测偏差时,提示“需要调音”,新手也能调好音。
  • 5分钟搞定AI绘画:Asian Beauty Z-Image Turbo快速部署与使用教程
  • 7个Linux系统管理员面试常见技术盲点及解决方案终极指南 [特殊字符]
  • CoPaw复杂逻辑推理与数学解题能力极限测试
  • AI绘画作品集:Anything V5图像生成服务实际效果与案例分享
  • 告别信道束缚:探究 Random Multiplexing 随机复用技术
  • Leather Dress Collection 实战:为开源项目自动生成 README 与贡献指南
  • 港大新作GS-SDF开源了!手把手教你用激光雷达+3DGS复现IROS2025论文效果(附避坑指南)