当前位置: 首页 > news >正文

阿里达摩院发布具身智能大脑基础模型 RynnBrain:首次赋予机器人时空记忆与物理推理能力

2026年2月10日,阿里巴巴达摩院正式发布其自主研发的具身智能基础模型RynnBrain,并同步开源包含30B MoE 架构模型在内的7个全系列模型,以及全新评测基准RynnBrain-Bench。这一发布标志着具身智能从“动作执行”迈向“认知理解”的关键一步。

两大核心能力:时空记忆 + 物理空间推理

传统具身模型常因缺乏长期记忆而“健忘”,或因脱离物理上下文而产生“幻觉”。RynnBrain 针对性地引入两项基础能力:

  • 时空记忆能力:使机器人能在完整历史轨迹中回溯物体位置、目标区域乃至运动路径,实现全局状态感知。例如,当执行任务A时被临时打断去处理任务B,RynnBrain 能准确记住任务A中断时的空间坐标与时间上下文,并在完成后无缝恢复。

  • 物理空间推理机制:摒弃纯文本推理范式,采用文本描述与空间定位交错进行的策略,确保每一步推理都锚定于真实环境,显著降低幻觉风险 。

技术底座:基于 Qwen3-VL,训练效率翻倍

RynnBrain 在Qwen3-VL 视觉语言模型基础上构建,采用达摩院自研的RynnScale 训练架构,在同等算力资源下训练速度提升2倍。模型训练使用超过2000万对高质量具身交互数据,其中包括专门生成的100万对“第一人称视角”OCR问答数据,用于提升对药瓶标签、门牌号等细粒度物理信息的理解能力 。

性能全面领先:16项SOTA,超越谷歌与英伟达

在权威评测中,RynnBrain 在16项具身开源榜单上刷新纪录(SOTA),涵盖:

  • 环境感知与对象推理
  • 第一人称视觉问答(FPVQA)
  • 三维空间推理
  • 运动轨迹预测

其综合性能已超越谷歌 Gemini Robotics ER 1.5英伟达 Cosmos Reason 2等国际顶尖模型 。

极致高效:30B MoE 模型仅激活 3B 参数

此次开源的RynnBrain-30B-MoE是业界首个采用混合专家(MoE)架构的具身大模型。尽管总参数达30B,但推理时仅激活约3B参数,即可超越72B稠密模型(如Pelican-VL)的效果,大幅降低硬件成本,同时提升机器人动作响应速度与流畅度 。

强可扩展性:数百条数据即可微调出SOTA专用模型

RynnBrain 具备优异的迁移能力。以具身规划任务为例,仅需几百条后训练样本微调,即可获得超越Gemini 3 Pro的性能,轻松达到SOTA水平。这使其有望成为导航、操作、任务规划等下游应用的统一基础模型 。

开源生态:模型 + 基准 + 代码全开放

达摩院此次不仅开源全部7个模型(含基础版与专用版),还发布了RynnBrain-Bench评测基准,首次系统支持时空细粒度具身任务评估,填补行业空白 。

达摩院具身智能实验室负责人赵德丽表示:“RynnBrain 首次实现了大脑对物理世界的深度理解与可靠规划,为‘大小脑分层架构’下的通用具身智能迈出关键一步。”

随着 RynnBrain 的全面开源,具身智能正加速从实验室走向工厂、厨房、物流等真实场景,推动 AI 真正“走进物理世界”。

大模型相关课程:

11.大模型的发展与局限性
21.1 ollama本地快速部署deepseek
31.2 linux本地部署deepseek千问蒸馏版+web对话聊天
41.3 linux本地部署通义万相2.1+deepseek视频生成
51.4 Qwen2.5-Omni全模态大模型部署
61.5 Stable Diffusion中文文生图模型部署
71.6 DeepSeek-OCR部署尝鲜
82.1 从零训练自己的大模型概述
92.2 分词器
102.3 预训练自己的模型
112.4 微调自己的模型
122.5 人类对齐训练自己的模型
133.1 微调训练详解
143.2 Llama-Factory微调训练deepseek-r1实践
153.3 transform+LoRA代码微调deepseek实践
164.1 文生图(Text-to-Image)模型发展史
174.2 文生图GUI训练实践-真人写实生成
184.3 文生图代码训练实践-真人写实生成
195.1 文生视频(Text-to-Video)模型发展史
205.2 文生视频(Text-to-Video)模型训练实践
216.1 目标检测模型的发展史
226.2 YOLO模型训练实践及目标跟踪
231.1 Dify介绍
241.2 Dify安装
251.3 Dify文本生成快速搭建旅游助手
261.4 Dify聊天助手快速搭建智能淘宝店小二
271.5 Dify agent快速搭建爬虫助手
281.6 Dify工作流快速搭建数据可视化助手
291.7 Dify chatflow快速搭建数据查询智能助手
302.1 RAG介绍
312.2 Spring AI-手动实现RAG
322.3 Spring AI-开箱即用完整实践RAG
332.4 LlamaIndex实现RAG
342.5 LlamaIndex构建RAG优化与实践
352.6 LangChain实现RAG企业知识问答助手
362.7 LangChain构建RAG企业知识问答助手实践
373.1 agent核心功能与概念
http://www.jsqmd.com/news/368499/

相关文章:

  • 2026年靠谱的钙基膨润土销售厂家采购建议选哪家 - 品牌宣传支持者
  • 2026年初临泉县高品质仿石漆施工方综合评选指南 - 2026年企业推荐榜
  • 2026年浙江企业苹果云手机服务商综合评估与精选推荐 - 2026年企业推荐榜
  • 临泉县外墙仿石漆施工公司精选与评测 - 2026年企业推荐榜
  • 2026年Q1湿法脱硫服务商综合评估:技术实力与商业价值并重 - 2026年企业推荐榜
  • 2026年评价高的防水膨润土/陶瓷膨润土厂家推荐哪家好(高评价) - 品牌宣传支持者
  • AcousticSense AI一文详解:如何用Vision Transformer‘看见’音乐风格
  • 2026年热门的升级爆破资质代办/安全监理爆破资质代办企业服务平台怎么联系 - 品牌宣传支持者
  • JavaWeb企业级开发---事务管理、AOP
  • 2026年评价高的上海外资公司注册公司推荐:上海自贸区注册公司、上海财务代理公司、上海财务代理记账选择指南 - 优质品牌商家
  • 2026年质量好的饲料膨润土哪家专业工厂直供推荐 - 品牌宣传支持者
  • 模型、框架、应用量产工作流,原力灵机三箭齐发开启具身智能元年
  • 2026年口碑好的非营业性爆破资质代办/一级爆破资质代办服务公司哪家专业如何选 - 品牌宣传支持者
  • 从Sora、谷歌Veo、字节Seedance到Kino视界:AI视频下半场竞争逻辑
  • Pi0机器人控制中心SpringBoot微服务架构设计
  • 1.1 《Life 3.0》没白看 AI 正在从工具变成员工
  • AI净界RMBG-1.4真实体验:连发丝都能完美保留的抠图工具
  • lychee-rerank-mm镜像免配置:Docker一键启动+模型预加载+UI自动映射
  • 通义千问1.5-1.8B-Chat-GPTQ-Int4在LaTeX文档编写中的智能排版辅助
  • 2026年透光混凝土公司公司权威推荐:发光混凝土/售楼部GRG/商场GRG/四川GRG厂家/四川透光混凝土厂家/选择指南 - 优质品牌商家
  • 5分钟部署Whisper语音识别:零基础搭建多语言转录服务
  • 回归测试压力大怎么破?10款测试用例管理工具对比与选型建议
  • 2026知识管理系统选型指南:5步评估法 + 12款产品对照
  • 2026年微滤机厂家最新推荐:污水处理工程改造、生活污水处理设备、絮凝沉淀池、MBR膜生物反应器选择指南 - 优质品牌商家
  • 经典歌曲免费下载分享
  • 【MySQL】SQL 调优
  • 2026年广东地区值得关注的五家艺术涂料品牌 - 2026年企业推荐榜
  • 新年歌曲免费分享
  • 【MySQL】SELECT 优化
  • 缩量在即,年前操作宜早不宜迟