SLIDER机器人:棱柱关节设计与混合零动力学控制
1. SLIDER机器人设计与控制研究概述
在双足机器人研究领域,传统采用全旋转关节的设计存在两个固有缺陷:当膝关节完全伸展行走时会产生奇异点问题,以及膝关节执行器增加了腿部重量和惯性。伦敦帝国理工学院机器人智能实验室开发的SLIDER机器人采用了一种革命性的无膝关节棱柱关节设计,通过直线型脚部和优化质量分布实现了超轻量化腿部结构,显著提高了行走能效。
最新改进的SLIDER机器人版本(如图1所示)在线型脚部设计基础上增加了偏航关节,并将所有执行器集中安装在髋部中心。这种设计使腿部重量进一步减轻,整机重量仅73.7克,是上一版本的80.9%。硬件上的关键创新包括:
- 采用6082T6铝合金板构建主体框架,实现高刚度重量比
- 差动绞盘驱动机构同时控制棱柱滑动关节和足部关节
- LML9B金属线性导轨确保腿部运动的精确约束
- 简化后的线接触足部设计充分利用侧向重力产生的角动量
2. 混合零动力学(HZD)的扩展与应用
2.1 传统HZD方法的局限性
混合零动力学(Hybrid Zero Dynamics)是处理欠驱动双足机器人运动控制的经典方法,其核心思想是通过虚拟约束将机器人动力学限制在低维流形上,并分析Poincaré映射来获得极限环。传统HZD方法具有两个关键特性:
- 存在性:在嵌入流形中存在满足虚拟约束的唯一极限环
- 收敛性:可以设计控制律使极限环邻域内的所有点渐近收敛到该曲线
然而,传统HZD仅适用于全旋转关节机器人模型,无法直接应用于SLIDER这类包含棱柱关节的系统,因为棱柱关节系统无法保证极限环的存在性。
2.2 扩展HZD(eHZD)方法
针对这一限制,研究团队提出了扩展HZD方法,核心创新在于建立了棱柱关节模型与虚拟旋转膝关节模型之间的映射关系(如图5-6所示)。具体实现步骤包括:
模型近似:将棱柱关节机器人近似为具有虚拟旋转膝关节的模型,通过改变足部与髋部距离模拟线性方向变化
质量假设:假设腿部和足部质量相对于髋部重量可忽略不计
状态转换:建立虚拟膝关节模型与棱柱模型之间的位置和速度转换关系:
⎡qα⎤ ⎡1 0 -l2/l⎤ ⎢qβ⎥ = ⎢0 1 -l1/l⎥ q'T ⎣ql⎦ ⎣0 0 -2l1l2cos(θ)⎦极限环转换:获得虚拟膝关节模型的极限环后,转换为棱柱模型的状态轨迹
这种方法成功地将HZD的优势扩展到棱柱关节系统,为后续步态库生成奠定了基础。
3. 基于eHZD的步态库生成
3.1 离线优化过程
研究团队使用FROST工具包进行无噪声理想非线性优化,在x方向[0.0 m/s, 1.2 m/s]和y方向[-0.1 m/s, 0.1 m/s]速度范围内,以0.05 m/s为间隔生成包含125种不同速度命令的步态库。每个步态包含26个自由度位置和速度信息,完整周期步态包含42个时间步长。
优化过程采用能量消耗作为成本函数:
L(θ) = Σ(1/T * Σ||τ(qt,qṫ)||²)其中T是每步的时间周期,τ是由HZD方法生成的控制律输出的扭矩。
3.2 步态特性分析
从获得的极限环(图8)可以观察到:
- 相似的速度命令产生相似的极限环
- 步态行为转换平滑,没有突变
- 在指定速度范围内,从虚拟膝关节空间到棱柱空间的映射是连续平滑的
这一步骤产生的步态库完整考虑了整个运动过程中的所有动态信息,但由于依赖精确模型和低噪声环境,生成的步态模式较为刚性,需要结合自适应控制方法提高鲁棒性。
4. 引导式深度强化学习控制框架
4.1 整体架构设计
为了将离线生成的步态库与在线自适应控制相结合,研究团队提出了如图7所示的引导式DRL框架,主要组件包括:
观察空间(Ot):包含235维输入,分为:
- 质心线速度和角速度(vlin, vang)
- 重量投影空间(gpro)
- 速度命令空间(C)
- 驱动状态位置和速度(qdof, qdoḟ)
- 高度点云(Ht)
动作空间(At):12维,表示所有驱动关节的目标位置,通过PD控制器映射到最终电机扭矩
神经网络结构:
- Actor和Critic网络均包含3个256神经元的隐藏层
- Actor将观察空间映射到动作空间
- Critic评估状态价值
4.2 奖励函数设计
系统的奖励函数(公式5)包含多个精心设计的组件:
Rt(Ot) = LMSE(Ot) - 0.5tanh(||τt||) - 3tanh(||vang||) - tanh(||vlin-vlin_des||) - tanh(||vang-vang_des||) + 2tanh(Ht) - tanh(||At-At-1||)其中:
- LMSE(Ot)确保当前状态与步态库中最接近步态的匹配度
- 扭矩项(||τt||)最小化能量消耗
- 速度跟踪项(||vlin-vlin_des||等)保证命令跟踪性能
- 高度项(Ht)维持身体平衡
- 动作平滑项(||At-At-1||)确保控制连续性
4.3 训练策略
针对线接触足部容易触发跌倒终止条件的问题,研究采用了分阶段训练策略:
预训练站立模型:
- 移除步态奖励项
- 增大站立平衡奖励
- 获得稳定的初始策略
步态训练:
- 基于站立模型初始化网络参数
- 引入完整奖励函数
- 使用PPO算法进行优化
训练在NVIDIA 4090 GPU上进行,利用Isaac Gym实现2048个环境并行训练,耗时约10小时完成40,000次迭代。
5. 实验结果与性能分析
5.1 速度跟踪性能
为验证控制策略在不同速度命令下的性能,研究团队设置了0.0-3.0 m/s范围内的速度跟踪测试,并与基于MPC和WBC的组合方法进行对比(表1)。成功平衡定义为能够连续跟踪期望速度10秒不触发任何终止条件。
关键发现包括:
- 在0.2-1.2 m/s范围内,新方法保持100%成功率
- 即使达到3.0 m/s,仍有73.1%的成功率(实际达到1.7 m/s)
- MPC方法在0.4 m/s以上速度性能急剧下降,1.0 m/s以上完全失效
5.2 误差分析
从均方误差(MSE)角度看:
- 新方法在中等速度下保持稳定的MSE(~0.02)
- MPC在低速(0.2 m/s)表现略优(MSE 0.00538 vs 0.0317)
- 随着速度提高,新方法展现出明显优势
5.3 综合性能提升
相比上一代MPC方法,新框架实现了:
- 最高行走速度提升150%
- 更宽的速度范围内保持稳定
- 更好的能量效率(得益于优化的步态和奖励设计)
6. 技术挑战与解决方案
6.1 棱柱关节控制的特殊挑战
SLIDER机器人采用棱柱关节设计带来了独特的控制难题:
- 长行程线性约束:需要精确的线性导向和扭矩传递
- 碳纤维管磨损:传统塑料轴承导致环氧基碳纤维管逐渐磨损
- 足部执行器布置:足部关节固定在腿部远端,随腿部摆动,造成传动链路设计复杂
6.2 差动绞盘驱动创新
研究团队借鉴Capler Leg和LIMS2系统的经验,设计了差动绞盘驱动机构(图3-4):
- 对称钢缆布置:每侧腿组件对称布置张紧钢缆,缠绕在执行器滑轮上
- 双执行器控制:两个相同执行器同时控制足部关节和滑动关节
- 同向旋转:驱动滑动运动
- 反向旋转:驱动足部旋转
- 线性导轨支持:采用LML9B金属线性导轨确保运动精度
这种设计实现了执行器集中布置,同时独立控制两个自由度,显著提高了系统可靠性和能量效率。
7. 实际应用中的注意事项
基于研究团队的实际经验,在应用eHZD与DRL混合框架时需特别注意:
步态库覆盖范围:
- 确保速度命令范围覆盖所有预期操作条件
- 在关键速度点增加采样密度(如接近极限速度的区域)
奖励函数调参:
- 各奖励项的权重需要平衡
- 过高的LMSE权重可能导致过于刚性,失去DRL的适应能力
- 过低的平滑项可能导致抖动
训练技巧:
- 预训练站立模型至关重要
- 逐步增加难度(如先低速后高速)
- 监控各奖励项贡献,及时调整
硬件实现考虑:
- 差动绞盘需要定期维护和张力调整
- 碳纤维管表面处理影响摩擦特性
- 执行器温度监控防止过热
8. 未来研究方向
当前研究为轻量化双足机器人控制开辟了新途径,但仍有一些方向值得探索:
- 混合控制架构:结合MPC框架进一步缩小仿真与现实差距
- 更高效的训练方法:探索元学习等技术减少训练时间
- 动态适应:开发可在线更新步态库的机制
- 硬件优化:研究新型材料和传动机构进一步提升能效
- 多任务扩展:验证框架在爬坡、避障等复杂场景的适用性
这项研究展示了模型基础方法与学习技术融合的潜力,为下一代轻量化双足机器人的发展提供了重要参考。特别是在辅助医疗和敏捷移动领域,这种高能效、高适应性的控制框架具有广阔的应用前景。
