基于多光谱成像的腹腔镜手术输尿管实时导航系统设计与实现
1. 项目概述:当腹腔镜手术遇上“透视”导航
在腹腔镜手术中,有一个让外科医生始终悬着心的“隐形杀手”——输尿管。这根连接肾脏与膀胱、负责输送尿液的管道,其解剖位置深藏于腹膜后,表面覆盖着腹膜和结缔组织。在常规腹腔镜的可见光视野下,它几乎与周围的脂肪、血管和结缔组织融为一体,难以直接辨识。然而,妇科、普外科及泌尿外科的许多手术区域,如子宫、结肠、大血管旁,恰恰是输尿管的“必经之路”。据统计,医源性输尿管损伤的发生率虽然不高,但一旦发生,可能导致尿漏、尿瘘、感染等严重并发症,给患者带来二次手术的痛苦,也是引发医疗纠纷的重要原因之一。
传统上,经验丰富的外科医生依靠对解剖标志的深刻记忆和触觉反馈(在开放手术中)来规避输尿管。但在微创的腹腔镜手术中,医生的手无法进入体腔,只能依靠器械和视觉。这就好比在浓雾中驾驶,仅凭记忆和模糊的地标前行,风险不言而喻。尽管有术前放置输尿管支架(双J管)等方法作为标记,但术中仍需通过器械触碰感知其硬度来间接判断,不仅操作繁琐,也无法提供直观、实时的视觉定位。
我参与的这项研发工作,核心目标就是为腹腔镜手术装上“透视眼”,让输尿管从背景中“亮”起来。我们设计并实现了一套基于多光谱成像的腹腔镜图像引导系统。其核心思路并不复杂,但实现起来却需要跨学科的精密协作:既然输尿管本身不显影,我们就主动给它做个“标记”。我们采用一根能传导特定波长光线的医用级塑料光纤(POF),像放置输尿管支架一样将其置入输尿管内。然后,我们改造了传统的腹腔镜成像系统,使其不仅能捕捉可见光下的腹腔场景,还能同步捕捉由这根光纤发出的、特定波长的红外光信号。最后,通过我们开发的自适应图像处理算法,将红外图像中提取的、代表输尿管的精确位置信息,实时、半透明地叠加到外科医生熟悉的可见光手术画面上。
这样一来,医生在屏幕上看到的,就是一幅“增强现实”般的手术视野:清晰的解剖结构之上,一条高亮的绿色线条(或其他醒目颜色)清晰地勾勒出输尿管的走行。这项技术的意义,远不止于一个酷炫的显示功能。它旨在从根本上降低因视觉盲区导致的医源性损伤风险,提升手术的安全性,同时也能缩短医生反复辨识解剖结构的时间,可能间接加快手术进程。接下来,我将从系统设计思路、关键技术实现、实验验证到未来展望,为你完整拆解这个项目的“里里外外”。
2. 系统核心设计:如何让不可见变为可见
要让输尿管在屏幕上“显形”,我们面临两个核心挑战:第一,用什么方法标记输尿管,并且这个标记信号要足够强,能穿透覆盖其上的组织;第二,如何在手术室强烈的内窥镜照明光(通常是高亮度的LED冷光源)干扰下,稳定、清晰地捕捉到这个标记信号。我们的系统设计正是围绕解决这两个问题展开的。
2.1 多光谱成像架构:给腹腔镜装上“复眼”
传统腹腔镜系统是单光谱成像,只有一个可见光摄像头。我们的创新在于引入了双光谱并行成像的架构。你可以把它理解为一台拥有“复眼”的腹腔镜:一只“眼睛”看颜色和纹理(可见光),另一只“眼睛”专门探测我们预设的标记信号(红外光)。
硬件系统的核心改造如下:
- 定制化内窥镜视频头:我们在传统腹腔镜的光路末端,集成了一台可见光CMOS相机和一台红外CCD相机。两者通过一个精密的分光棱镜共享来自腹腔镜物镜的入射光线。分光棱镜是关键,它能将混合光路中的可见光与红外光高效分离,并分别引导至对应的传感器,确保两路图像在空间上严格对齐(即共光轴),这是后续图像精准融合的基础。
- 双路独立图像采集与处理主机:我们开发了专用的图像处理主机。它具备双路视频采集卡,能同步接收并处理来自两个相机的视频流。主机还集成了为标记光纤供电的850nm红外激光器模块以及为腹腔镜照明的高亮度LED冷光源。同步性是生命线,必须保证可见光图像和红外图像是同一时刻腹腔内场景的写照,任何微小的延时都会导致融合图像中输尿管位置“漂移”,误导医生。
- 输尿管标记导管:这不是普通的导管。我们选用生物相容性极佳的医用级塑料光纤(POF)作为光导介质。其结构分为两层:高折射率的纤芯和低折射率的包层。当850nm的红外激光从导管近端耦合进入后,光在纤芯内以全反射方式传输,同时,我们通过对光纤侧面进行特殊的微处理,使一部分光能均匀地沿光纤长度方向侧向泄漏出来,形成一根发光的“光棒”。这根发光的POF导管,其直径、柔韧性与常规输尿管支架相当,可由医生在术前通过膀胱镜常规置入输尿管内。
注意:光源波长的选择是成败的关键。我们并非随意选择了850nm红外光。在预实验中,我们系统测试了LED白光、525nm绿光激光、655nm红光激光、940nm红外光及850nm红外光。将标记导管包裹约2mm厚的鸡肠脂肪组织模拟人体环境后发现,在强内窥镜照明光开启时,只有850nm红外光仍能保持较高的信噪比。这是因为人体组织(尤其是脂肪和血液)对850nm附近波长的红外光吸收相对较弱,散射也处于可接受范围,同时,常规内窥镜的LED光源在850nm波段的辐射强度较低,从而形成了天然的“光学窗口”,让我们的标记信号得以凸显。
2.2 软件处理流程:从原始信号到导航线
硬件捕获了原始数据,软件则负责从中提炼出精准的导航信息。我们的图像处理流水线可以概括为“分离-提取-融合”三步。
- 图像同步采集与预处理:系统驱动两个相机严格同步曝光和采集,获得一帧可见光彩色图像(RGB)和一帧红外灰度图像。红外图像中,明亮的区域即代表发出红外光的标记导管(输尿管位置),但边缘通常因光散射而模糊。
- 输尿管区域精确提取——SATS算法:这是我们的核心算法。直接对红外图像进行简单二值化(设定一个固定阈值)效果很差,因为光照不均、组织厚度不同会导致导管信号强度变化,固定阈值要么丢失弱信号部分(假阴性),要么把背景噪声也包含进来(假阳性)。我们提出了自适应阈值分割算法。
- 第一步:初始阈值估算。我们采用经典的大津法(OTSU)对单帧红外图像进行全局计算,自动找到一个能将图像直方图分为前景(候选输尿管区域)和背景两类的阈值
T_initial。这个方法能适应图像整体亮度的变化。 - 第二步:散射因子补偿。大津法找到的阈值是基于图像灰度分布,但未考虑光在生物组织中的散射效应。散射会导致光纤周围形成一圈光晕,使得用
T_initial分割出的区域比真实的光纤物理尺寸要大。为此,我们引入了一个散射因子ξ。我们的研究发现,在特定的组织厚度和光照条件下,这个散射导致的边界扩张宽度相对稳定。因此,最终的最优分割阈值T_optimal = T_initial + ξ。通过实验标定,我们将ξ设定为一个经验值(例如20个灰度级),这个操作能有效“��紧”分割边界,得到更接近导管物理位置的二值掩膜。 - 第三步:形态学后处理。对二值化后的图像进行简单的开运算(先腐蚀后膨胀),可以去除微小的孤立噪声点,并平滑输尿管区域的边缘,得到最终干净的输尿管二值图像
U(i, j),其中白色像素点代表输尿管位置。
- 第一步:初始阈值估算。我们采用经典的大津法(OTSU)对单帧红外图像进行全局计算,自动找到一个能将图像直方图分为前景(候选输尿管区域)和背景两类的阈值
- 图像实时融合与显示:这是呈现给医生的最后一步。我们将输尿管二值掩膜
U(i, j)以一种不干扰原始手术视野的方式叠加到可见光图像V(i, j)上。我们选择在绿色通道(G通道)上进行叠加,因为人体腹腔内组织(脂肪、腹膜、肌肉、血管)的色调以红、黄、白为主,绿色较为罕见,对比醒目。叠加公式为:V'_G(i, j) = V_G(i, j) + U(i, j) * α,其中α是透明度系数(例如设为100)。然后将修改后的G通道与原始的R、B通道合并,生成最终的融合图像F(i, j)。屏幕上,医生就看到了一条半透明的、高亮的绿色输尿管走向图叠加在真实解剖画面之上。
3. 关键技术与实现细节
一个想法从图纸到产品,中间充满了工程上的“魔鬼细节”。在这一部分,我将深入几个关键技术点,分享我们是如何解决具体问题的。
3.1 光源与波长的抉择:穿透力的博弈
为什么是850nm红外光?这个选择背后是组织光学特性的深度考量。光在组织中传播时,主要发生吸收和散射两种效应。血红蛋白、水对可见光(特别是蓝绿光)吸收很强;而红外光,特别是近红外波段(700-900nm),存在一个“治疗窗口”,组织吸收相对最小,穿透深度最大。
我们对比测试时发现:
- 可见光(LED白光):完全被内窥镜自身照明光淹没,信噪比极差。
- 525nm绿光激光:虽然激光方向性好,但组织散射严重,且血红蛋白吸收强,穿透脂肪组织后信号衰减超过80%。
- 655nm红光激光:穿透性优于绿光,但仍难以对抗强大的内窥镜背景光。
- 940nm红外光:水分子在这个波段有一个吸收峰,导致其穿透力反而不如850nm。
- 850nm红外光:处于水吸收较低、血红蛋白吸收也较弱的区域,散射虽然存在但相对可控。实验数据显示,在开启内窥镜强光下,850nm信号的平均灰度值下降幅度最小(约50%),仍能保持足够的对比度以供检测。
实操心得:光源功率的选择需要平衡。功率太小,信号弱;功率太大,可能产生局部热效应,存在安全风险。我们最终选择的850nm红外激光器功率在10-20mW量级,经过光纤传导和侧面发光后,到达组织表面的光功率密度远低于安全标准,同时已能满足成像需求。这个参数需要与光纤的发光效率一同进行严格的生物安全性评估。
3.2 自适应阈值算法(SATS)的工程调优
SATS算法中的散射因子ξ不是魔法数字,而是通过大量实验数据拟合出来的。我们在离体猪组织上,将发光光纤置于不同厚度的脂肪和肌肉组织下方,用红外相机拍摄。然后手动精确标注光纤的实际物理边界(作为金标准)。通过调整ξ值,计算分割结果与金标准之间的重叠度(如Dice系数),找到使重叠度最高的ξ值范围。
我们发现,ξ值并非完全固定。它轻微依赖于:
- 组织厚度:组织越厚,散射越严重,理想ξ值应略大。
- 光纤埋藏深度:深度增加,信号衰减,整体灰度下降,此时
T_initial会变小,但散射光晕的相对宽度可能变化不大。 因此,在系统标定时,我们设定了一个适用于大多数常规腹腔镜手术场景(组织厚度1-3cm)的默认ξ值。对于极端情况,算法预留了手动微调接口,但99%的情况下默认值已足够可靠。
算法加速实现:临床要求实时性(≥30帧/秒)。大津法虽然经典,但其遍历灰度直方图求类间方差最大值的计算量不小。我们在实现上做了两点优化:
- 积分图加速:计算图像灰度直方图时,使用积分图技术,将复杂度从O(N)降为O(1)。
- GPU并行计算:将图像分割和融合算法(特别是形态学操作和像素级叠加)移植到NVIDIA GPU上,利用CUDA进行并行处理。这是将平均处理时间压缩到6毫秒(约165帧/秒)的关键,远超30帧/秒的实时性要求。
3.3 系统集成与动物实验验证
硬件上,最大的挑战是小型化和灭菌。科研原型机可以很庞大,但临床设备必须能集成到现有的腹腔镜车中,且视频头需要能耐受高温高压或低温等离子灭菌。我们与内窥镜制造商合作,定制了小型化的双光谱相机模组,并将其封装在标准直径的腹腔镜镜鞘内。
动物实验(猪模型)是验证系统有效性的金标准。实验步骤如下:
- 麻醉与准备:对约60kg的实验猪进行全身麻醉,气管插管,机械通气,模拟真实手术环境。
- 置入标记导管:通过膀胱镜,将我们的发光POF导管置入猪的输尿管中。
- 建立气腹并置入腹腔镜:在猪腹壁建立穿刺孔,注入CO2形成气腹,然后将我们的多光谱腹腔镜置入。
- 数据采集与处理:系统开始工作。可见光相机提供清晰的腹腔解剖画面,红外相机同步捕捉发光导管信号。软件实时处理并融合,在显示器上输出导航图像。
- 结果评估:实验结束后,解剖暴露输尿管,用高精度测量工具在可见光图像上反推标注出输尿管的真实位置,作为评估算法精度的“地面真值”。
评估指标:我们采用医学图像分割领域通用的指标:
- 真阳性率(TPR):系统找对的输尿管像素占真实输尿管像素的比例。越高说明漏检越少。我们达到了93.8%。
- 阳性预测值(PPV):系统认为是输尿管的像素中,真正是输尿管的比例。越高说明误报越少。我们达到了90.6%。
- F1分数:TPR和PPV的调和平均数,综合衡量精度。我们的系统也表现优异。
这些数据表明,系统不仅能“看见”输尿管,而且看得“很准”。
4. 与现有技术的对比与优势分析
我们的系统并非第一个尝试解决输尿管可视化问题的方案。下面这个表格清晰地展示了我们方案与现有主流或研究中的方案之间的核心差异:
| 方法/技术 | 基本原理 | 准确性 | 处理速度/实时性 | 可用时机 | 主要局限性 |
|---|---|---|---|---|---|
| 术前静脉肾盂造影/逆行造影 | X光下注射造影剂显示尿路 | 高(解剖图) | 非实时,术前检查 | 术前 | 提供的是静态解剖图,无法反映术中因牵拉、肿胀导致的输尿管移位。 |
| 术中超声引导 | 超声探头直接扫描 | 中等 | 接近实时,但操作依赖技师 | 术中 | 提供的是横断面图像,不直观,需要医生在脑中重建三维位置,干扰手术流程。 |
| 输尿管支架(触觉感知) | 置入硬质支架,术中凭器械触感 | 低 | 实时但非视觉 | 术中 | 依赖医生手感,在微创手术中手感反馈差;无法提供视觉信息。 |
| 发光输尿管支架 | 支架末端发光,肉眼或摄像头观察 | 低 | 实时 | 术中 | 发光强度弱,极易被内窥镜强光淹没,临床实用性差。 |
| 近红外荧光成像 | 静脉注射吲哚菁绿(ICG),被近红外光激发荧光 | 中等 | 帧率较低(~15 fps),信号随尿液流动波动 | 术中 | 荧光信号弱,需要内窥镜紧贴组织;信号不连续;有极低概率过敏风险;成本高昂。 |
| ES-PDDE [23](我们早期工作) | 可见光标记,通过图像增强和曲线拟合提取 | 中等 | 较慢,存在图像闪烁 | 术中 | 依赖可见光标记,抗背景光干扰能力弱;算法复杂。 |
| ARES-UPD [24](我们改进工作) | 编码内窥镜光源,配合图像分割算法 | 较好 | 改善,达到实时 | 术中 | 仍使用可见光标记,系统需要控制光源闪烁,增加了复杂性。 |
| IGES-UD [25](我们红外方案初代) | 红外光标记,单相机分时成像 | 好 | 快 | 术中 | 单相机分时采集可见光与红外图像,存在运动伪影风险。 |
| 本系统(多光谱成像) | 850nm红外光标记,双相机同步并行采集 | 高(TPR 93.8%, PPV 90.6%) | 极快(~165 fps) | 术中 | 系统硬件更复杂,成本较高;需置入专用光纤导管。 |
我们的核心优势总结如下:
- 抗干扰能力强:采用850nm红外光作为标记信号,巧妙避开了内窥镜主照明光的频谱范围,从根本上解决了信号被淹没的问题。
- 成像质量高:双相机并行采集,可见光与红外光图像均以全帧率、全分辨率获取,不存在分时成像带来的运动模糊或时间差,融合图像清晰、稳定、无闪烁。
- 实时性卓越:专用算法结合GPU加速,处理速度远超视频显示所需的30fps,为未来集成更复杂的AI分析功能留出了充足的计算余量。
- 直观易用:输出结果直接是外科医生熟悉的腹腔镜画面叠加导航线,学习成本低,无需医生额外解读超声或造影图像。
5. 临床考量、局限性与未来展望
任何一项外科新技术,从实验室走向手术室,都必须经过严格的临床实用性审视。
临床优势与价值:
- 提升手术安全性:为医生提供了实时的、直观的输尿管“地图”,有望显著降低医源性损伤发生率,尤其是在复杂粘连、肿瘤侵犯或二次手术等高风险场景中。
- 可能缩短手术时间:减少医生反复辨识、分离组织以寻找输尿管的时间,使手术流程更流畅。
- 降低学习曲线:对于年轻外科医生或正在开展新术式的医生,该系统可以作为一个重要的辅助教学和训练工具。
当前局限性与挑战:
- 侵入性标记:仍需置入一根特殊的光纤导管。虽然操作与常规输尿管支架置入类似,但增加了术前步骤和材料成本。未来研究可探索无创标记方法,例如开发靶向输尿管壁的特异性红外荧光造影剂。
- 组织穿透深度极限:目前方案对于极度肥胖(腹壁脂肪过厚)或输尿管被厚实肿瘤组织完全包裹的情况,红外信号可能衰减到无法可靠检测的程度。需要进一步研究更长波长或不同模式的成像技术。
- 系统集成与成本:双光谱相机、专用图像处理主机增加了设备的复杂性和成本。如何将其小型化、模块化,并整合到现有主流腹腔镜系统中,是产品化的关键。
- 算法鲁棒性:当前算法在出血(血液会强烈吸收红外光)、烟雾等干扰下性能可能会下降。需要增强算法的抗干扰能力,例如结合深度学习模型来区分真实的导管信号与噪声。
未来发展方向:
- 人工智能深度集成:未来的系统不仅仅是显示输尿管位置。可以集成AI算法,实现风险预警。例如,当手术器械(如电钩、超声刀)尖端与虚拟的输尿管导航线距离小于安全阈值(如3mm)时,系统可以实时发出视觉(边框变红)或声音警报。
- 多目标结构与功能成像:将思路扩展,可以开发能同时显示输尿管、胆总管、重要血管等多重关键结构的“全景导航”系统。甚至进一步,结合光谱分析,实现组织血氧饱和度、缺血区域等功能性成像,为手术决策提供更多信息维度。
- 增强现实(AR)与手术机器人结合:将实时生成的输尿管导航线,通过AR眼镜投射到医生的真实视野中,实现真正的“透视”手术。或者与达芬奇等手术机器人系统深度整合,为机械臂提供避障约束,从辅助显示升级为主动安全保护。
我个人在项目推进中最深的一点体会是:医工结合的成功,关键在于“翻译”与“妥协”。工程师追求技术的极致(更高分辨率、更快帧率、更复杂算法),而外科医生需要的是稳定、简单、不增加额外操作负担的工具。很多时候,一个在实验室里精度达到99%的复杂算法,可能因为需要额外的校准步骤而被医生弃用;而一个只有95%精度但完全自动、一键运行的方案,反而更受青睐。我们这个项目从早期复杂的图像增强算法,演进到如今相对简洁的双光谱硬件方案,正是不断倾听临床反馈,在性能与易用性之间寻找最佳平衡点的结果。技术最终要服务于人,对于外科导航系统而言,可靠性、实时性和无缝的工作流集成,其重要性往往排在纯技术指标的前面。
