成本不到 5000 欧元!Matthias Plappert 公开在办公桌旁搭建机器人研究装置的研究过程
机器人研究现状与设想验证
如今,机器人研究成本和门槛大幅降低,小型团队甚至个人都能在真实硬件上开展有意义的研究。这得益于高性能机器人硬件价格下降和大量公开可用的基础模型。作者 Matthias Plappert 在 2017 - 2020 年于 OpenAI 从事机器人操作研究,当时成本高昂且需约 20 人团队。如今,他决定验证一个人坐在办公桌前开展机器人操作研究的设想,接下来几个月将独立研究并公开过程,关注研究日志。
搭建研究基础:明确需求
作者深知机器人研究需在真实硬件上进行,因此第一步是搭建实验装置。购买设备前明确了系统的需求,包括成本低于 10000 欧元、体积小巧可放办公桌旁、零部件易获取、易于通过 Python 操作、软件栈具灵活性。
物理装置搭建
作者搭建了单臂桌面操作装置,选择单机械臂是为简化、节省空间和降低成本,虽对任务类型有限制,但也带来研究方向。视觉上采用双摄像头设置,一个安装在机械臂手腕,一个固定在桌子上。使用 6 自由度太空鼠标远程操作,还放置可折叠宜家桌子分隔工作空间。
材料清单包含 UFACTORY xArm Lite 6 机械臂、夹爪、摄像头等,总成本 4569.80 欧元,不包含增值税和计算资源成本。作者选择 UFACTORY xArm Lite 6 机械臂是因其可靠、价格实惠且有实用 Python SDK。夹爪虽有不足,但可更换。手腕摄像头选 Intel RealSense D405,固定摄像头选 Logitech C920。太空鼠标提供 6 自由度输入,作者将动作空间限制在 4 个维度。
软件设置开发
软件设置涵盖传感、控制、远程操作等功能,作者从头编写名为 `robo` 的 Python 包,代码约 3000 行,运行在 Mac 上。作者未基于 ROS 2 或 LeRobot 构建软件栈,而是自己编写,原因是要完全控制软件栈和深入理解系统。
架构上,所有任务在一个 Python 进程中运行,组件通过内存发布/订阅事件总线通信,有 `Service` 和 `Event` 两个核心抽象。传感和控制方面,机器人观测器轮询机械臂发布状态,远程操作控制器将太空鼠标事件转换为机器人命令。遥测和可观测性通过 Prometheus、InfluxDB 和 Grafana 实现。数据记录使用 Rerun,将事件写入 `.rrd` 文件,还可转换为 LeRobot v3 数据集。策略推理部分,计划将其从机器人设备分离到 NVIDIA DGX Spark 上。
