当前位置: 首页 > news >正文

EHRWorld:以患者为中心的医疗世界模型用于长期临床轨迹预测

EHRWorld: A Patient-Centric Medical World Model for Long-Horizon Clinical Trajectories

摘要

本研究提出EHRWorld,一个基于真实电子健康记录的患者中心医疗世界模型,能够准确模拟疾病进展和治疗结果的长期演化过程。

阅读原文或https://t.zsxq.com/K2HQ0获取原文pdf


引言:医疗AI的新范式

在追求通用人工智能的道路上,世界模型(World Models)作为一种关键范式正在崭露头角。世界模型通过构建环境的全面内部表征,能够根据先前的行动模拟未来状态,从而支持在实际执行之前进行想象性规划 。这种推理能力对于在复杂且不断演变的环境中进行有效的自主决策至关重要,但在医疗等高风险现实领域中实现这一目标仍然充满挑战 。

医疗实践是一个极具吸引力的世界模型应用场景。临床实践涉及高度复杂的系统,其中从生理测量、影像学检查到实验室检测和临床叙述等异构信号随时间相互作用。临床决策——如药物选择、剂量和时机——可以改变患者未来的生理状态 。因此,临床医生必须常规性地进行反事实推理,隐式地思考在不同治疗方案下结果会如何变化。准确建模各种治疗策略下的长期患者状态转换对于有效和个性化护理至关重要 。

现有LLM面临的挑战

近年来,大型语言模型(LLMs)在医疗AI领域取得了显著进展,在临床报告生成、诊断推理和医学问答等多个任务上表现出色 。这些成功引发了一个自然的问题:经过海量医学教科书、文献和临床病例报告训练的LLMs,能否作为世界模型来模拟临床指标和治疗结果的时间演化?

然而,研究表明,虽然这些模型能够准确复制单个时间点的临床观察,但当模拟超出静态信息范围时,它们就会遇到困难。更重要的是,当干预事件发生时,它们难以在内部维持一致的患者状态。这些现象导致多步交互中的错误累积,反映出缺乏跟踪潜在生理状态的显式机制 。

如图1所示,标准的基于LLM的模拟器无法推断隐式生理状态或在医疗干预后正确更新患者状态,而提出的EHRWorld模型则保持了逻辑一致性和鲁棒性。氯化物水平在八轮模拟中的相对误差轨迹表明,EHRWorld模型显著限制了错误传播速度,与GPT-5.2相比展现出更大的性能优势 。

EHRWorld-110K:大规模纵向临床数据集

为了解决上述局限性,研究团队建立了一个强大的数据基础,策划了大规模临床数据集EHRWorld-110K,该数据集源自真实世界的电子健康记录(EHRs) 。

数据构建流程

数据构建管道包含三个主要阶段 :

  1. 从非结构化临床笔记中提取患者静态档案:使用LLMs(如Qwen3-235B-A22B-Instruct)处理非结构化出院摘要,提取患者层面的静态信息,包括结构化的人口统计属性(如年龄和性别)以及分层诊断集,涵盖主要和次要诊断 。

  2. 组织时间顺序的事件序列:从带有时间戳的事件日志中提取原始临床事件,组织成涵盖整个住院期间的事件序列。每个事件根据其临床作用和是否产生可观察值进行分类 :

    • 询问事件(Inquiry Events)

      :对应于对患者状态的被动观察,如实验室检测和体格检查,产生明确的测量值

    • 干预事件(Intervention Events)

      :对应于旨在改变患者状况的主动临床行动,如药物管理和医疗程序,旨在修改患者状态但不直接产生可观察结果

  3. 整合与质量过滤:在住院情节层面整合患者档案和事件序列,随后进行严格的质量过滤 。

数据集规模与特点

EHRWorld-110K数据集总计包含约11万个多样化的住院情节和1750万个高度临床相关的事件,涵盖从入院到出院的完整轨迹 。这个数据集为学习纵向真实临床护理中的患者状态演化和干预条件转换提供了原则性基础 。

为支持可靠评估并保留真实临床数据的多样性,研究团队使用基于主要诊断类别的分层抽样对构建的数据集进行划分。这产生了一个包含579个住院情节的保留测试集,包括84,010个询问事件和25,798个干预事件,涵盖1,043种独特的主要和次要诊断条件,确保各种临床场景的全面代表性 。

EHRWorld模型:患者中心的世界模型

基于这一基础,研究团队引入了一种生成式训练范式,将临床轨迹建模为连续的顺序过程,促进干预驱动的生理转换学习。然后在不同参数规模下训练了一系列模型——EHRWorld 。

模型架构与机制

研究团队将患者模拟形式化为一个序列决策过程,其中临床交互在由t索引的离散模拟步骤上演化。每一步对应一个生理时间戳τt,模拟器建模患者状态如何响应一组并发临床行动而演化 。

如图2下半部分所示,EHRWorld被设计为一个条件世界模型,显式跟踪患者状态并在顺序询问和干预下更新它们。模型采用双模式预测机制 :

  • 对于干预事件:模型产生潜在结果

  • 对于询问事件:模型预测明确的测量值

通过确定性状态转换(更新循环),模型维持交互历史,实现顺序轨迹模拟 。

核心功能

EHRWorld作为演化的患者模拟器,基于交互历史和治疗输入动态学习和更新生理状态 。这种设计使模型能够:

  1. 维持一致的患者状态表征

  2. 准确模拟干预后的生理变化

  3. 减少长期模拟中的错误累积

  4. 提高临床敏感事件期间的稳定性

评估结果:显著优于基线模型

通过广泛的评估,研究团队证明EHRWorld显著优于朴素的基于LLM的基线模型,表现出以下特点 :

  1. 长期模拟中错误累积显著减少:在八轮模拟中,EHRWorld对氯化物水平的相对误差保持稳定,而GPT-5.2的误差持续累积,性能差距不断扩大

  2. 临床敏感事件期间的增强稳定性:模型在处理关键临床事件时展现出更好的鲁棒性

  3. 改善的推理效率:与其他模型相比,EHRWorld在计算效率上也有显著提升

这些发现强调了在因果基础、时间演化的临床轨迹数据上进行训练对于确保可靠建模的重要性 。

主要贡献与创新

本研究的主要贡献包括 :

  1. 大规模纵向数据集:引入EHRWorld-110K,一个捕获从入院到出院完整高保真患者临床护理轨迹的大规模纵向数据集,使得能够研究时间演化和潜在的干预条件临床动态

  2. 统一的患者中心模型族:提出EHRWorld,一个在因果顺序范式下训练的统一患者中心医疗世界模型族,通过维持和更新响应临床干预的生理状态来模拟动态疾病进展

  3. 全面的评估验证:结果表明EHRWorld在长期临床模拟中显著优于朴素的基于LLM的基线,具有减少的错误累积和改善的稳定性

未来展望

EHRWorld的成功展示了在医疗领域构建可靠世界模型的可行性。这种方法不仅能帮助临床医生将健康视为一个持续演化的过程,还为估计和利用临床行动因果效应的AI系统提供了原则性基础 。

未来的研究方向可能包括:

  • 扩展模型以处理更多样化的临床场景

  • 整合多模态医疗数据(如影像学和基因组学数据)

  • 开发更精细的因果推理机制

  • 在实际临床决策支持系统中进行验证

通过在因果基础、时间演化的临床数据上进行训练,EHRWorld为医疗AI开辟了新的可能性,有望在个性化医疗、治疗规划和临床决策支持等领域发挥重要作用 。

标签

#WorldModels #ClinicalAI #医疗人工智能 #电子健康记录 #临床轨迹模拟 #精准医疗

http://www.jsqmd.com/news/389590/

相关文章:

  • SCI期刊投稿被AI检测退回?核心期刊降AI的正确操作流程
  • 2026年评价高的铝塑共挤门/铝塑共挤隔音窗热门厂家推荐汇总 - 行业平台推荐
  • 2026年靠谱的随钻声波测井换能器/声波测井换能器厂家推荐与选购指南 - 行业平台推荐
  • 2026年知名的军工航空航天定制角度头铣头/昆山镗床加长铣头优质供应商推荐参考 - 行业平台推荐
  • 综述不会写?AI论文软件 千笔·专业论文写作工具 VS 笔捷Ai 本科生专属利器
  • 2026年评价高的环保干燥剂/车用干燥剂好评厂家曝光 - 行业平台推荐
  • 2026年热门的铝塑共挤节能型材/铝塑共挤厂家推荐与选购指南 - 行业平台推荐
  • 用过才敢说! 降AIGC平台 千笔·专业降AIGC智能体 VS 万方智搜AI,研究生必备!
  • 用AI高效实现小说转短剧:编程实操全指南
  • 3D砂型打印机什么牌子好?2026十大品牌权威推荐与选购指南 - 匠言榜单
  • 导师严选!千笔写作工具,本科生论文写作神器
  • 客服成功秘诀:自动化工具与流程优化
  • AI+编程实战:小说高效改编短剧全指南
  • 维普AIGC检测总是红?实测两个工具帮你从67%降到安全线
  • 2026年口碑好的家用除湿包/车内除湿包人气实力厂商推荐 - 行业平台推荐
  • 把自信押在结果上,心态一定扛不住波动
  • 2026年知名的宁波甲醇催化剂/乙二醇催化剂用户口碑认可厂家 - 行业平台推荐
  • 通义千问+DeepSeek+Kimi降AI指令合集:15个实用Prompt(2026最新)
  • 题解:洛谷 P1104 生日
  • 2026年质量好的丁辛醇工艺包/宁波丙烯酸工艺包厂家热销推荐 - 行业平台推荐
  • 万方文察AIGC检测不通过?实测降到安全线的完整方案
  • 【2026】 LLM 大模型系统学习指南 (70)
  • 信息数据需要存储到数据仓库,实现持久化存储
  • 【2026】 LLM 大模型系统学习指南 (71)
  • 2026年口碑好的3296电位器/3590电位器优质厂家推荐汇总 - 行业平台推荐
  • 2026年比较好的防腐螺旋钢管/贵州镀锌钢管厂家采购参考指南(必看) - 行业平台推荐
  • 精准掌握长尾关键词优化技巧助力SEO效果显著提升
  • 阿里小云KWS模型在儿童玩具中的创新应用
  • Linux内核中的container_of宏详解 - 指南
  • OFA模型在Typora中的图像描述插件开发