当前位置：首页 > news >正文

M-RAG：让你的RAG更快、更强、更高效

news 2026/4/9 8:21:14

Retrieval-Augmented Generation (RAG) 通过引入外部知识缓解了大语言模型(LLM)的知识局限和幻觉问题，已成为提升模型可靠性的主流范式。然而，传统RAG系统严重依赖**文本分块（Text Chunking）**策略来构建检索单元，这带来了固有的结构性缺陷。

Figure 1: 分块导致的信息碎片化和结构丢失

如图1所示，分块过程如同用剪刀裁剪文档，会打断原始文档的语义链（Semantic Chains），导致三种关键问题：**信息碎片化（Fragmentation）**破坏了语义连贯性；**噪声引入（Noise Introduction）**增加了无关内容；**全局上下文丢失（Loss of Global Context）**削弱了文档级推理能力。

虽然长上下文LLM的出现让"直接处理完整文档"成为可能，但这并不能解决相关性过滤和证据优先排序的核心需求。为此，本文提出M-RAG，一种无分块（CHUNK-FREE）的检索新范式。

方案：键值解耦的元标记检索

Figure 2: M-RAG整体架构

M-RAG的核心创新在于键值解耦（K-V Decomposition）设计。如图2所示，系统首先通过Marker Extractor从完整文档中提取结构化的元标记（Meta-markers），每个标记被显式分解为两个互补组件：

检索键（k）：轻量级语义锚点（约19-20 tokens），针对查询意图优化，作为高效的"锚点"用于相似度匹配
信息值（v）：上下文丰富的内容块（约50-65 tokens），保留完整的事实关系用于生成

Table 1展示了标记提取的Prompt设计原则。系统要求LLM生成细粒度的标记，每个标记严格覆盖1-3个段落（优选1-2个），并通过段落重叠确保完整覆盖。提取过程采用零样本或少样本提示，无需任务特定训练。

组件	设计要求
k (检索键)	生成一个详细问题，既总结内容又作为检索查询，包含关键实体和概念
v (信息值)	200-300字自包含段落，聚焦单一事实，消除代词歧义，绑定具体属性
paragraph_indices	最多3个段落索引（0-2个为最佳），必须重复使用段落以确保全覆盖

检索阶段，系统仅在轻量级的k上进行相似度计算（采用HNSW算法），再根据token预算动态选取对应的v进行生成。这种设计实现了检索效率与生成质量的彻底解耦：查询匹配在紧凑的语义空间完成，而生成仍能获得完整的上下文支持。

效率与效果的双重提升

实验在LongBench的NarrativeQA、Qasper和2WikiMultihopQA任务上进行。如Table 2所示，M-RAG在低token预算（128×1）下表现尤为突出，在Qasper任务上相比Fixed-Size、Semantic和PIC基线分别提升**37.2%**、**9.2%和14.2%**，证明了在资源受限场景下的优势。

如图4所示，M-RAG的平均检索延迟显著低于基于分块的方法（在Qasper上仅需214ms，而Semantic需要226ms，PIC需要331ms）。这是因为相似度计算仅在轻量级的k上进行，避免了长文本块的嵌入计算开销。

Figure 4: 检索时间对比

进一步分析表明，M-RAG实现了**99.8%**以上的文档覆盖率，且k与v的token长度比稳定在1:2.5至1:3之间。这种稳定的解耦结构使M-RAG成为传统分块RAG的可扩展、鲁棒替代方案，为长上下文环境下的知识检索提供了新的设计思路。

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～