当前位置: 首页 > news >正文

AI学习 - 诊断结论信息抽取 - LabelStudio 标注

结论内容:
平均心率为71次/分,最快心率是123次/分,发生于01-13 08:28:51,最慢心率是48次/分,发生01-14 02:25:11,其中心动过速事件(心率>100次/分),持续时间占总时间的3.6%,心动过缓事件(心率<60次/分),持续时间占总时间的26.9%. 房性早搏共发生124次.占总心搏数的<0.1%.包括105次单发房早.1次成对房早.2次房速.1次二联律. 室性早搏共发生1323次,占总心搏数的0.4%,包括.1318次单发室早.1次室速. 诊断: 1、窦性心律(心率波动于48次/分--123次/分之间) 2、偶发房性早搏(105次单发房早.1次成对房早.2次房速.1次二联律) 3、多源性室性早搏(1318次单发室早.1次室速) 4、心率变异性分析:SDNN 160.54(正常参考值范围:102-180ms),SDANN 150.60(正常参考值范围:92-162ms)

标注
针对心电图(Holter)报告的结构化信息提取任务,标注需求不是典型的命名实体识别(Named Entity Recognition, NER)

NER 主要用于识别非结构文本中的离散实体(如人名、地点、疾病名)。报告文本已经是半结构化的数据描述,包含了明确的指标名称和数值。

更合适的 Labeling Setup 选择是:

1. 首选:Object Detection with Bounding BoxesTextSpan 的变体

  • 原因:你的任务更像是从报告中定位并分类不同的数据片段(如“平均心率”、“71次/分”、“123次/分”等),并为它们分配特定的标签(如指标名称数值单位时间等)。这本质上是对文本中连续片段(span)的分类。
  • 在Label Studio中,你可以使用 Named Entity Recognition 模板,但需要重新定义“实体”。把“指标名称”、“数值”、“单位”、“日期时间”等作为你的实体类型,而不是传统的人名、地名。

2. 具体配置建议:

标签配置(Labeling Interface)示例:

使用以下XML配置(在Label Studio的Labeling Setup中选择Custom模板,然后粘贴):

<View><Labels name="label" toName="text"><Label value="指标名称" background="#FFA39E"/><Label value="数值" background="#D4380D"/><Label value="单位" background="#FFC069"/><Label value="日期时间" background="#FFD666"/><Label value="诊断结论" background="#95DE64"/><Label value="事件类型" background="#5CDBD3"/><Label value="占比/频率" background="#69C0FF"/></Labels><Text name="text" value="$text"/>
</View>

3. 标注任务定义:

  • 指标名称:如“平均心率”、“最快心率”、“最慢心率”、“房性早搏”、“室性早搏”、“SDNN”、“SDANN”。
  • 数值:如“71”、“123”、“48”、“3.6%”、“26.9%”、“124”、“1323”、“160.54”、“150.60”。
  • 单位:如“次/分”、“ms”、“%”。
  • 日期时间:如“01-13 08:28:51”、“01-14 02:25:11”。
  • 诊断结论:如“窦性心律”、“偶发房性早搏”、“多源性室性早搏”、“心率变异性分析”。
  • 事件类型:如“单发房早”、“成对房早”、“房速”、“二联律”、“单发室早”、“室速”。
  • 占比/频率:如“占总时间的3.6%”、“占总心搏数的<0.1%”。

4. 为什么这不是传统的NER?

  • 传统NER的实体通常是开放域、有限类型(如PER, LOC, ORG)。你的任务更接近 信息抽取(Information Extraction)结构化数据提取,需要定义领域特定的、细粒度的标签类型。

总结与操作步骤:

  1. 在Label Studio中,创建一个新项目。
  2. Labeling Setup页面,选择Custom模板。
  3. 将上面的XML配置粘贴到代码区域。
  4. 导入你的心电图报告文本(可以每份报告作为一个任务)。
  5. 开始标注时,用鼠标选中文本片段,并选择对应的标签(如“指标名称”、“数值”等)。

这样,你就可以系统地从报告中提取出结构化的字段,为后续构建心电图知识库或临床决策支持系统打下基础。

image

http://www.jsqmd.com/news/254250/

相关文章:

  • 2026年 工业摄像头厂家推荐排行榜:高清/防爆/井下/旋转/检测等专业摄像头品牌深度解析与选购指南 - 品牌企业推荐师(官方)
  • UE5 C++(36-2):
  • 想找靠谱的杭州拼多多代运营公司?这份清单值得看 - 前沿公社
  • 全自动阴离子洗涤剂分析仪厂家推荐盘点选型攻略,国内外品牌核心对比 - 品牌推荐大师1
  • 在config全局配置
  • 探秘山东推拉门、山东平开门出厂前必经的2个独有环节:顶立固为何让批发商更放心? - 讯息观点
  • 本地化文档工具Outline的部署和使用
  • 【Vivado错误日志】[DRC REQP-1741]IDELAY3 drivers invalid load :IDELAY3 DATAOUT pin may not drive a BUFG*
  • 这一篇PPO写的不错,有机会再仔细看看
  • 2026年GEO平台源码源头推荐,专业搭建服务商 - 源码云科技
  • 简单明了的将卡尔曼滤波器讲清楚 - MKT
  • 【信道估计】基于matlab LSE和MMSE MIMO OFDM系统信道估计【含Matlab源码 14945期】
  • 手持式空气颗粒计数器哪家强?2026年品牌实力综合测评 - 品牌推荐大师1
  • 2026年 影像仪厂家推荐排行榜:二次元影像仪,半自动影像仪,测量影像仪,全自动影像检测仪器品牌实力深度解析 - 品牌企业推荐师(官方)
  • python基于django的社区志愿者活动签到服务平台是设计与实现
  • 2026年最新CE修改器下载安装教程(Windows系统实测版)
  • 【波束成形】基于matlab最小相差多用户毫米波大规模MIMO系统混合波束成形【含Matlab源码 14944期】
  • 【信道估计】粗量化大规模MIMO系统的计算高效最大似然信道估计【含Matlab源码 14946期】
  • 【windows11】windows11安装
  • 【PPT】使用VSCODE+MARP输出PPT
  • 导师严选2026 TOP8一键生成论文工具:专科生毕业论文写作全攻略
  • 海外仓库存积压是“利润黑洞”还是“烫手山芋”?TOPWMS 助您破局! - 跨境小媛
  • SQL查询性能优化 - EXISTS、IN
  • 【程序员必看】voyage-context-3向量模型发布:RAG检索效率提升14%,存储成本仅0.5%,香不香?
  • 2026年 金属零部件试制加工厂家推荐榜单:汽车/航空航天/电子电器钣金软模、热成型、激光切割及DV/EV/PV工程件专业试制 - 品牌企业推荐师(官方)
  • 你以为的生病,其实是身体在救你
  • 【AI技术yyds】百度搜索新范式、多智能体协作...信息检索领域最新研究成果全解析,开发者必看!从AI搜索到多模态推荐,一篇搞定所有前沿技术!
  • 小白必看!MCP协议让AI智能体实现“模块化自由“,告别硬编码噩梦!大模型开发新范式来了!
  • 以机器学习为基础的房价预测分析研究(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)
  • 基于深度卷积神经网络的网络流量检测与识别(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)