当前位置: 首页 > news >正文

LIBERO介绍

什么是 LIBERO?

LIBERO 是一个专门为具身智能和机器人操作设计的仿真基准测试平台(Benchmark)。它建立在 MuJoCo 物理引擎之上,为研究人员提供了一个高度标准化的虚拟环境。

OpenVLA是一个极其聪明但没有实体的"赛博大脑",那么LIBERO 就是给这个大脑提供身体、任务(例如:抓取碗放到盘子里)和虚拟世界的仿真平台

在底层的技术栈上,它是这样构成的:

  1. MuJoCo (物理引擎):最底层的物理法则。它负责计算重力、摩擦力、机械臂关节的碰撞和动力学。
  2. robosuite (机器人框架):建立在 MuJoCo 之上,专门为机械臂(如 Franka, Panda)提供标准化的 Python API 接口。
  3. LIBERO (任务套件):建立在 robosuite 之上。它精心设计了 130 个不同的桌面操作任务,并录制了极其高质量的人类专家遥控演示数据(这就是你之前用snapshot_download下载的 15GB 数据)。

LIBERO 的核心特色:它把任务分成了四大类:

  • Spatial (空间):同一种物品,放在不同的位置(考查模型的空间方位感知)。
  • Object (物体):同样的动作,操作不同的物体(考查模型的物体识别)。
  • Goal (目标):同样的物体,执行不同的指令(比如把碗推向左边 vs 推向右边)。
  • 10-task / 90-task:考查模型连续学习几十种任务会不会“灾难性遗忘”。

OpenVLA 与 LIBERO 的终极闭环控制流

运行评估脚本后, OpenVLA 和 LIBERO 会形成一个频率为 10Hz(每秒 10 次)的闭环控制系统

这个10Hz 是由训练数据集的采样频率 和 Llama-2 7B 自回归的推理速度决定的

LIBERO 有 物理时钟和控制时钟两个时钟系统

  1. 控制时钟去接收 OpenVLA 下发的动作操作目标
  2. 物理时钟去执行这个动作操作目标

这个闭环系统分为 4 个步骤:

  1. 查看环境 和 给出命令

LIBERO 环境(env)初始化后,会通过虚拟摄像机渲染出当前桌面的 RGB 图像(通常是 256x256 分辨率)。 同时,环境会给出一个字符串指令,例如"pick up the black bowl"

  1. OpenVLA推理

OpenVLA 接收图像和指令,按照我们在openvla.pyprismatic.py中分析过的逻辑:

  • 图像被切成 Patch 变成 Embeddings。
  • 结合文本提示词送入 LLaMa-2 大脑。
  • 模型自回归地吐出 7 个离散的词汇(Tokens),例如[<action_128>, <action_135>, <action_128>, ...]
  1. 翻译和物理映射
  • 这 7 个 Token 被翻译到 [-1 , 1]之间的归一化浮点数 (比如[0.0, 0.05, 0.0, ...])。
  • 接着,利用dataset_statistics.json中记录的 LIBERO 环境专用极值(action_highaction_low),将这些比例放大为真实的物理尺度(比如 $X$ 轴移动 $0.015$ 米)。
  1. OpenVLA -> LIBERO 执行

最终生成的 7 维浮点数数组action = [dx, dy, dz, droll, dpitch, dyaw, gripper]被送回给 LIBERO。 LIBERO 底层的 MuJoCo 物理引擎接收到这 7 个微小的位移量,驱动虚拟的 Franka 机械臂移动几毫米。然后环境渲染出新的图像,进入下一个循环!

http://www.jsqmd.com/news/605453/

相关文章:

  • ESP32+1.3寸屏保姆级教程:用PlatformIO搞定TFT_eSPI和LVGL驱动(附完整代码)
  • OpenClaw成本优化:千问3.5-35B-A3B-FP8自部署接口替代高价API
  • JetBrains IDE试用期重置:2026年开发者如何优雅应对评估限制?
  • QT集成海康威视SDK实战指南:从.h、.lib到.dll的工程化配置解析
  • ESP32项目内存告急?手把手教你优化xiaozhi-esp32开源代码的内存与功耗(FreeRTOS实战)
  • OpenClaw安全防护指南:Qwen3-32B私有化部署的权限控制实践
  • 生化与分子生物学是搞不定导师的脑子的
  • C语言新手必看:哪些开发工具别乱用?
  • Flink checkopint使用教程
  • 大学物理(Ⅱ)核心公式解析与应用指南
  • PVE内存管理全攻略:如何避免CT容器内存超配导致的OOM问题
  • HDLbits通关秘籍:Rule 90/110与生命游戏,用Verilog玩转细胞自动机(附完整代码)
  • SEO案例教程有哪些
  • SEO_从0到1的SEO实战教程,手把手教你操作
  • OpenClaw+千问3.5-9B对比测试:3种模型接口性能实测
  • 网站优化过程中如何防范黑帽SEO行为
  • 花了一周,我做出了第一个游戏(打砖块),这些坑你别再踩了(持续更新中)
  • QGIS+OpenStreetMap实战:用DEM和建筑数据生成3D城市模型(含Aerialod配置)
  • OpenClaw技能扩展实战:千问3.5-35B-A3B-FP8助力内容自动化处理
  • 告别UNCLAIMED!在Jetson AGX Orin上为Intel AX200网卡‘注入灵魂’的完整指南
  • 泛型:类·学习笔记
  • 未发表!25年顶级SCI算法SOO优化CNN-LSTM-Attention一键实现多步预测!多步预测全家桶更新啦!
  • STM32duino驱动X-NUCLEO-IKS5A1多传感器融合开发指南
  • 高效解放双手:OnmyojiAutoScript阴阳师智能自动化工具全解析
  • 红外遥控技术原理与电路设计实践
  • 事件驱动的本质的庖丁解牛
  • 从芯片手册到实际电路:聊聊74HC74、74HC112这些D/JK触发器芯片怎么用(附常见坑点)
  • 【Java设计模式 | 创建者模式】单例模式
  • 在Ubuntu虚拟机上玩转QNX 8.0:手把手教你搭建嵌入式开发环境
  • 飞书机器人进阶:OpenClaw接入Kimi-VL-A3B-Thinking处理群聊图片