当前位置：首页 > news >正文

ZGI 双向溯源：让 AI 的每一个回答都有据可查

news 2026/3/26 18:18:56

我们寄予厚望的 RAG（检索增强生成）技术，旨在通过引入外部知识来纠正大模型的“幻觉”。但在实践中，一个尴尬的局面屡见不鲜：RAG 系统精准地检索到了相关文档，却依然输出了一个与文档内容不符，甚至完全捏造的答案。模型看起来言之凿凿，实则漏洞百出。

问题的核心在于“单向流程”的缺陷。传统 RAG 是一个开环系统：“检索”->“生成”。大模型接收检索到的文档片段，然后基于其内部参数“自由发挥”出最终答案。它没有强制性义务去严格遵循、引用或验证所提供片段的具体内容。一旦模型出现“走神”或过度推断，错误便会产生。

这警示我们：提升外部知识库的质量和检索的召回率只是基础，确保 AI 的回答与这些知识严格对齐，才是实现可靠性的关键一步。我们需要的不仅是一个更强大的检索器或更大的模型，而是一个能约束、验证生成过程的新系统框架。

为了从根本上解决这个问题，ZGI （https://www.zgi.cn/)提出了“双向溯源”技术。它并非对传统 RAG 的简单优化，而是一次架构层面的重构，将一个开环流程转变为“生成-验证”的强约束闭环。

第一向：前向生成
与传统 RAG 类似，系统根据问题检索出最相关的知识片段（Chunks）。但在生成最终答案时，模型被强制要求精确引用它所依据的具体片段，并为回答中的关键主张标注出处。

第二向：反向验证
这是技术突破的关键。在答案生成后，系统不会立刻输出，而是启动一个独立的验证阶段：

只有通过验证、所有核心主张均有据可查的答案，才会被最终输出。如果发现不一致，系统会触发自动修订，或明确标识出“该部分无法完全证实”，将不确定性透明化。

“双向溯源”带来的不仅是数字上的精度提升，更是工程实践范式的转变：

可调试性：当答案出现问题时，开发者可以精确溯源。是检索阶段遗漏了关键文档？还是生成阶段无视了现有证据？抑或是验证阶段的标准过于严苛？每一步都有迹可循，将“黑箱”问题转变为可定位、可优化的模块化问题。
可信交付：对于金融、法律、医疗等高风险领域，一个“大致正确”的答案毫无价值。能够附带证据链的回答，让 AI 的输出具备了可审查性，极大降低了业务风险，使得 AI 能在更严肃的场景中落地。
成本优化：它避免了对“万能大模型”的盲目追求。通过强化验证环节，开发者可以在保证最终效果的前提下，更灵活地选择性价比高的基础模型与检索方案，将资源用在刀刃上。