当前位置：首页 > news >正文

RL VLA - kirin

news 2026/7/12 11:04:15

Dual-System
Each module performs its designated role, endowing the system with generalization capabilities for training-free execution in unseen environments

VLA-Planner + RL-Controller(vlp-humanoid)
residual RL（PLD，self-improved VLA）
VLA as Router，dynamically activate diverse RL skill policies(vlp-humanoid)

RL in training pipeline
Leveraging RL to address compounding errors and OOD challenges in VLA models during long-horizon tasks.

online/offline fine-tuning for auto-regression-based VLA（RL4VLA）
preference optimization for diffusion-based VLA（DPPO）
fine-tune flow-based VLA（πRL，Flow-noise/Flow-SDE）

RL in inference
Leveraging RL to mitigate hallucinations and prevent hazardous actions in VLA models during critical physical contact phases

Similar to MCTS, select actions with higher Q-values(V-VLAPS)

VLA reversely empowers RL
VLA does not directly control, only guides RL

VLA as reward design(Eureka)
VLA as world model(RL in Latent Space)
VLA as critic

http://www.jsqmd.com/news/461158/

相关文章：

C语言第37章调试技巧与常见错误：理论与实操精解-001篇

C语言第37章调试技巧与常见错误：理论与实操精解-002篇

Flutter 三方库 hrk_logging 的鸿蒙化适配指南 - 实现标准化分层日志记录、支持多目的地输出与日志分级过滤

Flutter 三方库 fluent_result 的鸿蒙化适配指南 - 实现优雅的函数式错误处理模型、支持透明的结果封装与业务逻辑流转控制

Flutter 三方库 crypto 的鸿蒙化适配指南 - 实现具备工业级哈希算法与消息摘要计算的安全底座、支持端侧数据校验与数字签名实战

Flutter 三方库 shelf_web_socket 的鸿蒙化适配指南 - 实现具备高性能全双工长连接与协议协商能力的端侧服务端架构、支持分布式实时信令与多端协同实战

别只用标准功能码了！C#扩展Modbus协议：自定义0x6F批量写入+设备专属异常码，效率提3倍

降AI率工具哪个效果好？2026年主流降AI工具综合测评对比！ - agihub

知网AI率狂飙到80%？实测7款主流降AI神器！ - 老米_专讲AIGC率

2026年主流降AI工具横评：哪款能帮你把AI率降到个位数？ - 晨晨_分享AI

【航天存储公司】推荐！解决数据存储安全痛点的靠谱企业排行？

计算机专业毕业设计 / 课程设计全攻略

2026 计算机毕业设计全攻略：源码 + 教程 + 答辩指导

2026 计算机毕设终极指南：Java/Python/单片机/小程序，源码+文档+保姆级教程

2026计算机毕设终究救赎：从选题到丝滑答辩，这一篇就够了！

springboot基于android的ai历史模拟交互系统的设计与实现

springboot基于Android的健身房助手系统app

警惕！小龙虾虽好，但别轻易装进你的工作电脑

springboot基于Android的医院陪诊护理服务系统APP

springboot基于Android的地球村共享书屋平台的图书馆图书借阅管理系统

小米电脑管家卸载彻底卸载

springboot基于Android的学生综合测评成绩信息管理系统安卓

springboot基于安卓Android的校园失物招领APP

信奥赛C++提高组csp-s之数论基础专题课：从同余到分数模运算2(知识详解：同余、裴蜀定理、扩展欧几里得、乘法逆元、分数模运算)

springboot基于安卓校园外卖点餐系统商家

信奥赛C++提高组csp-s之数论基础专题课：从同余到分数模运算3(案例实践：裴蜀定理)

springboot基于安卓的酒店客房预约管理APP

springboot安卓Android的快递物流管理系统

springboot安卓充电站冲充电桩预约APP视频