当前位置: 首页 > news >正文

HumanEgo 论文主实验硬件解析:Trossen WidowX AI 双臂工作站实操方案

当前视觉操作(VLA)、具身模仿学习算法普遍存在数据采集门槛高的问题:主流训练方案依赖大量机器人遥操作轨迹,单套双臂设备采集数十小时数据,人力与硬件损耗成本高昂;同时算法高度绑定特定机械臂,跨设备零样本泛化能力薄弱。马里兰大学发表相关 HumanEgo 框架给出全新解法,主实验真实场景验证基于 Trossen Robotics WidowX AI 双臂工作站(Stationary AI 套件)完成。

一、HumanEgo 框架核心技术链路

HumanEgo 核心逻辑是彻底脱离机器人采集环节,仅使用普通人佩戴 Meta Aria 智能眼镜(MPS 感知管线)录制分钟级第一视角视频训练操作策略:

1.数据采集端:Meta Aria 内置 MPS 感知管线,原生输出高精度 6DoF 相机 SLAM 轨迹、21 点手部三维关键点、同步 RGB 画面,无需实验室标定,居家场景即可完成倒水、收纳、取物等任务演示;

2.算法核心创新:提出交互中心 Token (ICT) 表征,剥离相机、机械臂运动学差异,只保留手与物体的相对空间关系;搭配多稠密辅助目标流匹配策略,充分挖掘少量人类视频内监督信号;

3.量化实验结果:仅 15 分钟人类演示视频平均任务成功率 75%,30 分钟数据可达 92.5%,同等时长下性能超越遥操作基线 41%,支持跨 WidowX AI、UR10、Franka 三类机械零样本泛化。

二、实验真机硬件:Trossen WidowX

论文四组居家实操任务均采用两台 WidowX AI 组成Stationary AI双臂工作台:

1.单臂硬件参数:6 自由度串联结构,配套平行夹爪末端执行器,最大有效载荷 1.5kg,末端重复定位精度 ±1mm;

2.实验部署方案:工作台上方架设 Intel RealSense D405 作为全局唯一视觉输入,全程未启用机械腕部相机,严格复现算法纯全局视觉训练逻辑;

3.平台适配优势:开源底层控制接口,兼容 MuJoCo、ROS、各类视觉大模型,是可开展双臂模仿学习对照实验的常用科研硬件。

三、算法与硬件协同科研价值

HumanEgo 框架具备硬件无关特性,训练完成的策略可零样本迁移至 WidowX AI、Franka、UR10 多类机械臂;对于课题组而言,搭配 Trossen WidowX AI 双臂设备,可大幅缩减机器人数据集采集周期,快速迭代居家柔性抓取、多物体整理类具身 AI 模型。

论文 arXiv 查阅链接:https://arxiv.org/abs/2605.24934

欢迎关注 “欣佰特科技” ,持续为大家带来 “具身智能领域” 前沿技术及应用!详情可邮件咨询sales@cnbestec.com

http://www.jsqmd.com/news/1075636/

相关文章:

  • JavaScript安全审计:从代码层面挖掘垂直越权漏洞的实战指南
  • 硅基流动上线高速版 Kimi K2.7 Code
  • 2026 完整版 Claude Code 入门教程:从零安装、环境配置到核心命令实战
  • 如何选择最适合的macOS屏幕录制工具:QuickRecorder技术深度解析与实战指南
  • Dapr:分布式应用开发的通用运行时
  • 在Rust中tokio::spawn和tokio::task::spawn_blocking的区别
  • 终极指南:如何用OpCore Simplify快速构建黑苹果EFI配置
  • 【TEE从入门到精通及实战】56 密钥的物理销毁与安全删除:TEE环境下的“灰烬”艺术
  • 算法竞赛经典题解:分治动态规划与回溯
  • FMPy:统一多平台FMU仿真与系统建模的Python解决方案
  • 摩尔线程亮相MWC上海,全栈智算矩阵赋能云边端
  • 参考文献格式乱如麻?师兄推荐这几个AI论文网站
  • AI 产品的 UX 要升级了:UX 3.0 把“可用性“换成“协同质量“
  • 摆脱线缆束缚:用LoRa无线技术加速工业数据采集系统部署前言
  • 为什么Pyodide能让你在浏览器中运行完整的Python科学计算?
  • 补充02:Oracle业务库运维实操(EAP生产数据库)
  • 大模型对齐实战:SFT与RLHF原理、陷阱与工程化落地
  • 补充05:EAP夜班OnCall值守SOP\+交接班标准化台账模板
  • 补充04:200mm八寸老厂SECS\-I改造\新旧EAP并行迁移方案
  • ArduSub水下飞控实战指南:从原理到南海30米部署
  • 支付逻辑漏洞深度剖析:从业务安全原理到实战挖掘与修复
  • 百元级也能玩转工业数据采集:DABL7689入门级方案的成本与性能平衡之道
  • 30天自制操作系统:从零到一构建属于你的计算机世界
  • OPC UA通信避坑指南:C#与各类PLC通信的最佳实践
  • OpenCR深度解析:TurtleBot3的实时控制核心与硬件调试指南
  • MPC8560中断控制器与I2C接口深度解析:嵌入式系统实时通信与中断管理实践
  • 2026年口碑好的工业粘合剂生产厂家 行业资深从业者经验分享
  • FFXIV TexTools:为什么这是《最终幻想14》玩家必备的模型修改神器?
  • 2026好用AI头脑软件排名:个人创意梳理多人协作场景完整选型指南
  • XGBoost抗标签噪声实战:动态权重+梯度截断提升鲁棒性