当前位置：首页 > news >正文

从单目到双目：利用aruco_ros和USB相机实现低成本机器人室内定位全流程

news 2026/6/3 11:35:00

从单目到双目：低成本机器人室内定位系统实战指南

去年在为一个仓储AGV项目做POC验证时，客户提出了一个看似矛盾的需求：既要实现厘米级定位精度，又要求硬件成本控制在千元以内。面对这个挑战，我们最终选择了ArUco二维码+普通USB相机的方案。本文将分享这套低成本定位系统的完整实现路径，从硬件选型到ROS集成，手把手带你避开我踩过的那些坑。

1. 硬件选型与相机标定：单目vs双目的抉择

在机器人定位系统中，相机就像人类的眼睛，选对型号直接影响定位精度。市面上常见的USB相机从几十元的普通摄像头到上千元的工业相机应有尽有，我们需要根据项目需求找到最佳性价比方案。

1.1 单目相机的经济之选

对于预算极其有限或对精度要求不高（±5cm）的场景，罗技C920这类1080p摄像头就能满足需求。它的优势显而易见：

价格亲民：全新设备仅需300-500元
即插即用：免驱动安装，ROS有现成的usb_cam驱动包
资源占用低：对计算平台要求不高，树莓派4即可流畅运行

但单目系统有个致命弱点——无法直接获取深度信息。就像人闭上一只眼睛后难以准确判断物体距离，单目相机需要通过运动或多帧图像才能估算出二维码的3D位置。这会导致：

初始定位需要移动机器人采集多帧数据
动态环境下定位容易漂移
对二维码的视角变化敏感

# 单目相机标定命令示例 rosrun camera_calibration cameracalibrator.py \ --size 8x6 --square 0.024 \ image:=/usb_cam/image_raw

提示：标定板方格边长参数(--square)务必测量准确，误差要控制在0.1mm以内

1.2 双目相机的精度提升方案

当项目需要更高精度（±1cm）或静态定位能力时，双目套件是更好的选择。市场上现成的双目模组如小觅相机标准版（约1500元）已经集成好了同步触发功能。如果追求极致性价比，也可以自行组装两个同型号USB相机：

配置项	单相机方案	双目方案
硬件成本	300-500元	600-1500元
定位精度	±3-5cm	±1-2cm
计算需求	低	中等
适用场景	低速AGV/教育项目	工业AGV/无人机精准降落

双目标定比单目复杂得多，需要同时采集左右相机的图像对。推荐使用以下命令启动标定：

rosrun camera_calibration cameracalibrator.py \ --size 8x6 --square 0.024 \ right:=/right_camera/image_raw \ left:=/left_camera/image_raw \ right_camera:=/right_camera \ left_camera:=/left_camera

我在实践中发现几个关键点：

标定时要确保两个相机能同时看到完整的标定板
相机间距越大，深度测量越精确，但视野重叠区域会变小
使用--approximate 0.1参数可以加速标定过程

2. ArUco标签的智能布设策略

ArUco标签相当于机器人的"路标"，布设方式直接影响系统可靠性。经过多个项目验证，我总结出一套高效的标签部署方法论。

2.1 标签生成与打印规范

使用在线生成器(如chev.me/arucogen)创建标签时，要注意：

字典选择：推荐使用DICT_4X4_50或DICT_5X5_50，平衡识别距离和抗干扰能力
尺寸设计：打印尺寸与检测距离比为1:10（如20cm标签最大检测距离2米）
打印质量：使用哑光相纸，避免反光影响识别

# Python生成自定义ArUco标签示例 import cv2 aruco_dict = cv2.aruco.Dictionary_get(cv2.aruco.DICT_4X4_50) img = cv2.aruco.drawMarker(aruco_dict, id=23, sidePixels=600) cv2.imwrite("marker23.png", img)

2.2 空间布局的黄金法则

在仓库环境中部署标签时，采用"三层金字塔"布局效果最佳：

顶层（2.5m高）：大尺寸标签（40cm）作为全局定位基准
中层（1.5m高）：中等标签（30cm）提供区域定位
底层（0.5m高）：小标签（20cm）用于精准停靠

这种布局的优点是：

机器人无论处于什么位置都能看到3-5个标签
不同大小标签自然形成层级定位系统
减少单一标签失效导致定位丢失的风险

重要：标签安装时要确保与墙面垂直，倾斜角度不超过15°

3. aruco_ros的深度配置技巧

aruco_ros是ROS生态中最成熟的ArUco识别包，但默认配置可能无法满足项目需求。下面分享几个实战验证过的优化技巧。

3.1 参数调优实战

修改single.launch文件时，这些参数值得特别关注：

<param name="marker_size" value="0.2"/> <!-- 与实际打印尺寸严格一致 --> <param name="threshold" value="7"/> <!-- 识别阈值，光照差时调低 --> <param name="ref_frame" value=""/> <!-- 留空则使用相机坐标系 --> <rosparam param="detect_rate">30.0</rosparam> <!-- 识别频率 -->

对于双目系统，还需要配置视差参数：

stereo_params: min_disparity: 0 max_disparity: 128 window_size: 11

3.2 坐标变换的艺术

将/aruco_single/pose转换为TF坐标系是集成到导航栈的关键步骤。推荐使用以下节点配置：

#!/usr/bin/env python import tf import rospy from geometry_msgs.msg import PoseStamped def pose_callback(msg): br = tf.TransformBroadcaster() position = msg.pose.position orientation = msg.pose.orientation br.sendTransform((position.x, position.y, position.z), (orientation.x, orientation.y, orientation.z, orientation.w), rospy.Time.now(), "aruco_marker", "camera_link")

这个转换建立了从相机到标签的坐标关系，但实际应用中我们更需要知道机器人相对于标签的位置。这时候需要在TF树中添加静态变换：

rosrun tf static_transform_publisher 0 0 0 0 0 0 1 base_link camera_link 100

4. 导航栈集成与性能优化

获得稳定的位姿信息后，如何让机器人真正"用上"这些数据？这里介绍两种主流集成方案。

4.1 作为AMCL的初始位姿

对于使用激光雷达的机器人，可以将ArUco定位结果作为AMCL的初始位姿估计：

<node pkg="amcl" type="amcl" name="amcl"> <param name="initial_pose_x" value="$(arg initial_pose_x)"/> <param name="initial_pose_y" value="$(arg initial_pose_y)"/> <param name="initial_pose_a" value="$(arg initial_pose_a)"/> <remap from="scan" to="/laser/scan"/> </node>

通过动态参数服务器更新初始位姿：

rospy.set_param('/amcl/initial_pose_x', marker_pose.position.x) rospy.set_param('/amcl/initial_pose_y', marker_pose.position.y)

4.2 纯视觉定位方案

在没有激光雷达的系统中，可以构建基于ArUco的纯视觉定位：

在RViz中创建包含所有标签位置的参考地图
通过识别到的标签ID和位姿计算机器人全局坐标
发布到/odom话题供move_base使用

def calculate_global_pose(marker_poses): # marker_poses包含所有识别到的标签位姿 global_x = sum([p.position.x for p in marker_poses])/len(marker_poses) global_y = sum([p.position.y for p in marker_poses])/len(marker_poses) return (global_x, global_y)

4.3 性能优化技巧

在高动态环境中，定位系统可能面临这些挑战：

标签被临时遮挡
光照条件剧烈变化
相机运动模糊

通过以下策略提升鲁棒性：

多标签融合：同时跟踪3-5个标签，采用加权平均算法
运动预测：结合IMU数据预测标签位置
曝光控制：动态调整相机曝光参数

// 简单的加权融合算法示例 for(auto& marker : detected_markers) { weight = 1.0 / marker.err; total_weight += weight; weighted_x += marker.x * weight; weighted_y += marker.y * weight; } final_pose.x = weighted_x / total_weight; final_pose.y = weighted_y / total_weight;

在最后一个仓储AGV项目中，这套方案实现了以下性能指标：