当前位置：首页 > news >正文

科学事实核查中的原子分解与不确定性门控检索技术

news 2026/6/22 23:11:18

1. 科学事实核查的技术挑战与创新方案

在生物医学、材料科学等高价值专业领域，科学事实核查面临着独特的技术挑战。传统基于大型语言模型的方法往往存在三个致命缺陷：一是容易产生"幻觉"推理，即在证据不足时编造看似合理实则错误的结论；二是难以处理复杂的谓词-论元结构，导致对技术性声明的理解偏差；三是证据使用不一致，同一文档中相互矛盾的陈述可能被同时引用。

这些问题的根源在于现有系统大多采用"端到端"的黑箱验证模式。它们直接将整个声明与文档进行匹配，忽略了科学声明通常由多个相互关联的原子事实组成这一特性。例如，声明"双气囊小肠镜检查在社区环境中既有效又安全"实际上包含两个需要独立验证的原子事实：(1)关于有效性的陈述；(2)关于安全性的陈述。

我们提出的技术方案通过四个关键创新点解决了这些痛点：

原子事实分解：使用推理能力强的LLM将复杂声明拆解为25词以内的最小语义单元，每个单元表达一个完整的谓词-论元关系。这种分解借鉴了OpenIE和PropBank语义角色标注的思想，但针对科学文本进行了优化。
语义证据对齐：对文档进行分块处理（约420字符的滑动窗口），使用text-embedding-3-large模型计算原子事实与各文本块的嵌入相似度。选择余弦相似度最高的片段作为本地证据，这比传统的全文匹配更精准。
轻量级验证器：采用MiniCheck-7B作为核心验证引擎。这个经过校准的模型专门针对证据接地的验证任务进行优化，输出支持概率而非简单的二元判断。我们设置0.8和0.25作为高低置信度阈值，中间区间视为不确定状态。
不确定性门控检索：只有当原子事实的支持概率处于不确定区间(0.25-0.8)时，才会触发定向网络检索。检索范围严格限制在PubMed、WHO、CDC等权威来源，避免噪声干扰。

关键设计原则：系统的每个组件都遵循"必要最小复杂度"原则。不引入过度工程，确保整个流程可解释、可审计。例如，原子事实长度限制在25词内既保证了语义完整性，又避免了复杂句带来的验证困难。

2. 系统架构与工作流程解析

2.1 整体处理流水线

系统采用模块化设计，各组件通过严格定义的接口交互。图1展示了完整的处理流程：

声明分解模块：接收自然语言声明和关联文档，输出JSON格式的原子事实集合。每个事实包含唯一ID、文本内容和目标谓词标记。
证据选择器：对输入文档进行重叠分块处理，使用嵌入模型为每个原子事实匹配最相关的本地证据片段。备选方案包括：
- 基于嵌入的语义匹配（首选）
- 基于词重叠的启发式方法（回退方案）
验证核心：MiniCheck-7B模型接收事实-证据对，输出校准后的支持概率。验证过程采用二进制分类而非多类NLI，以降低跨领域时的标签漂移。
检索增强模块：针对不确定事实生成精确定制查询，从预设权威源获取补充证据。检索结果经摘要处理后与本地证据拼接，形成增强证据集。
裁决聚合器：最终决策LLM接收高置信度事实集合（支持/反驳），生成结构化输出：
- 最终裁决（支持/反驳/NEI）
- 解释性依据（引用事实ID）
- 使用的事实列表