当前位置：首页 > news >正文

医疗机器人缝合技术：模仿学习与精准控制的融合应用

news 2026/8/2 22:42:22

1. 机器人缝合技术概述

机器人缝合技术是医疗机器人领域的重要研究方向，它结合了模仿学习（Imitation Learning）和精准控制（Precision Control）两大核心技术。模仿学习通过人类示范数据训练机器人，使其能够学习复杂的缝合动作序列；而精准控制则确保机器人在执行缝合任务时达到毫米级的精度要求。这两种技术的结合为自动化手术提供了新的可能性，特别是在需要高精度和长序列操作的场景中。

1.1 技术背景与挑战

传统的手术机器人系统如达芬奇手术系统（Da Vinci Surgical System）虽然提供了精确的控制和增强的灵活性，但仍然需要外科医生的持续输入。这种依赖人工操作的模式存在几个关键限制：

操作者疲劳：长时间手术会导致外科医生疲劳，影响手术质量
人为误差：即使是经验丰富的外科医生也可能出现操作失误
结果变异性：不同医生的技术水平差异会导致手术效果不一致

机器人缝合技术面临的特殊挑战包括：

组织变形和操作不确定性的适应
毫米级精度的要求
长序列动作的协调
复杂环境下的实时决策

1.2 技术发展现状

目前主要有几种控制方法被用于实现机器人缝合的自主性：

混合方法：结合运动规划、计算机视觉、机械引导和预测建模
模型预测控制(MPC)：使用特定任务模型在每个时间步优化机器人动作
模仿学习(IL)：直接从人类示范中学习任务，提供强大的恢复能力和适应性

这些方法各有优劣。混合方法和MPC虽然能实现高精度，但在泛化性和错误恢复方面存在困难；而模仿学习虽然在适应性方面表现优异，但需要大量高质量的示范数据。

2. 核心技术与实现方案

2.1 系统架构与实验平台

本研究使用达芬奇研究套件(dVRK)作为实验平台，这是一个广泛使用的研究型手术机器人系统。实验设置包括：

机器人系统：dVRK Si版本
任务表面：软组织缝合垫(3-D Med)
缝合线：绿色编织聚酯缝合线(3-0 Ethibond)
工具配置：左臂配备DeBakey钳，右臂配备大号针驱动器
视觉系统：两个腕部摄像头(5.5mm内窥镜)

提示：dVRK平台的选择至关重要，因为它提供了与临床系统相同的核心功能，同时为学术研究提供了可重复的实验环境。

2.2 缝合任务分解

我们将缝合过程分解为三个子任务：

针拾取(Needle Pickup)：
- 两个夹持器位于伤口上方
- 左夹持器抓住针尖附近
- 将针传递给右夹持器，右夹持器抓住针基部
针穿刺(Needle Throw)：
- 右夹持器驱动针穿过伤口后壁
- 旋转针并穿过前壁
- 释放针并重新抓取突出的缝合线
- 将针拉出缝合垫
打结(Knot Tie)：
- 右夹持器顺时针将缝合线绕左夹持器一周
- 左夹持器稍微打开，抓住缝合线的松散端
- 左右夹持器向相反方向拉紧完成打结

2.3 数据集构建

我们收集了1890个高质量示范，包括：

基础示范：展示如何完成每个子任务
恢复示范：从常见失败状态开始，展示如何恢复并完成任务

数据集特点：

每个示范包含同步的视觉和运动学数据
机器人运动学以结构化CSV文件记录
视觉数据包括立体内窥镜和两个腕部摄像头的RGB图像
手动标注每个针穿刺示范的插入和退出点

为提高策略的鲁棒性和泛化能力，我们在示范中引入了多种变化：

机器人关节配置差异
RCM(远程运动中心)位置变化
缝合垫放置和方向变化
针的初始姿态变化
腕部摄像头安装的轻微扰动

3. 策略架构与训练

3.1 分层策略架构

我们采用分层架构：

高级策略：
- 基于Swin Transformer
- 将视觉观察编码为token
- 生成语言指令
低级策略：
- 接收语言指令、最新视觉观察和目标条件
- 输出相对机器人动作块
- 比较了三种VLA模型：π0、GR00T N1和OpenVLA-OFT

3.2 目标条件表示

我们探索了三种目标条件格式来引导针放置：

点标签(Point Labels)：
- 在内窥镜图像上叠加不透明的蓝色(插入点)和绿色(退出点)像素
二值掩码(Binary Masks)：
- 三通道图像，分别表示插入掩码、退出掩码和零通道
距离图(Distance Maps)：
- 三通道图像，前两个通道编码指向插入点的归一化像素偏移向量
- 第三通道是标量热图

实验结果表明，点标签方法实现了最低的平均误差(ACT:1.3±0.9mm, π0:1.0±1.3mm)，在统计上显著优于其他方法。

3.3 训练细节

保留12个示范作为评估集
使用L1回归的模型训练至少10,000步
使用MSE的模型(π0和GR00T N1)通常需要更少的步数
所有训练在NVIDIA DGX A100系统上进行

4. 评估与结果

4.1 评估指标

针拾取：120秒内完成左夹持器抓针和右夹持器固定为成功
针穿刺：
- 穿刺子任务：120秒内针穿透后壁和前壁为成功
- 拉出子任务：60秒内将针从组织中拉出并返回起始位置为成功
打结：120秒内完成绕线、抓取和拉紧为成功
插入和退出误差：使用紫外线标记测量实际缝合点与目标点的欧氏距离
过程时间：计算所有成功任务的时间总和

4.2 主要结果

低级策略比较：
- ACT表现最佳，完成了3/10的端到端缝合
- ACT的平均插入误差为1.5±0.8mm
- π0紧随其后，平均插入误差为1.9±1.0mm
预训练评估：
- 标准π0检查点略优于其他预训练变体
- π0从头开始训练的性能下降较小，说明该任务与π0预训练领域差异较大
高级策略评估：
- 高级策略的F1分数为0.92，准确率为88.73%
- 在任务转换检测方面达到100%的F1分数和准确率
- 与人工提供语言条件的oracle评估结果相近
泛化能力：
- π0在未见过的伤口类型上表现与训练伤口相当
- ACT在未见伤口上性能明显下降
- 两种策略在光照和工具变化下性能都显著下降