当前位置: 首页 > news >正文

机器人“大脑”路线之争:WAM崛起,VLA会被淘汰吗?创业公司如何应对?

WAM攻克了哪些难关?

要理解WAM的价值,得先搞清楚VLA的问题出在哪。VLA的训练逻辑很直观:模仿人类遥控操作。但现实不是实验室,这些在人类看来微不足道的变化,对VLA机器人来说却是巨大的挑战。换言之,VLA学习到的是一种极其脆弱的、标准化的“条件反射”,很难推广到复杂的现实场景。

WAM提供了完全不同的思路。它的核心是预测和理解。这种物理想象力带来的第一个突破,是泛化能力的跃升。HarmoWAM的研究表明,在背景、位置、物体语义都发生变化的零样本场景中,WAM的表现比之前的SOTA级别VLA模型提升了33%。

泛化能力的突破之外,WAM还完成了另一件更具产业意义的事情:对数据来源的结构性松绑。VLA长期被困在遥操作数据这座昂贵的小岛上,而WAM可以像大语言模型学习互联网文本一样,去学习海量的、现成的、每天都在产生的人类第一视角视频。智在无界的Being - H0.7直接用20万小时的人类视频进行预训练,银河通用的LDA模型更进一步,把仿真数据、人类视频和机器人操作数据混在一起联合训练。

不仅如此,WAM还在另一个长期困扰机器人领域的难题上取得了进展,那就是长程任务能力。VLA通常只能处理两到三个动作的简单任务,时序稍有拉长就容易迷失。而生数科技的Motubrain已经能够完成十个原子动作级别的复杂任务。

国内团队在这条赛道上的进展速度,值得关注。银河通用的LDA - 1B有清华大学、北京大学和英伟达的联合署名;生数科技的Motubrain登顶两项国际榜单;智在无界的Being - H0.7综合排名全球第一。与此同时,海外前沿实验室同样在快速推进。英伟达提出的DreamZero在真机实验中展现出对新任务和新环境的强大泛化能力,较顶尖VLA模型提升2倍以上。

VLA被杀死了吗?

WAM的方向是对的,但“VLA已死”这个判断,需要冷静审视。一方面,WAM确实展现了令人兴奋的技术潜力,智在无界用20万小时人类视频预训练的Being - H0.7,能够在6项国际评测中拿下综合排名第一。另一方面,这套判断背后也有一套商业叙事。英伟达是全球最大的AI芯片供应商,WAM对GPU算力的需求远超VLA。Jim Fan力推WAM,对英伟达来说意味着更大的芯片出货量和更高的单价。

抛开商业立场,WAM自身也还有硬骨头要啃。一方面,在需要毫米级定位或双臂协同的精密装配任务中,WAM的表现明显弱于专注动作优化的VLA模型,且推理延迟虽然经过优化仍高于后者。另一方面,数据与算力门槛也不低。并且,当任务涉及抽象语言指令或复杂社交语境时,纯物理世界建模容易看懂画面但听不懂人话。

事实上,VLA在现阶段仍有WAM难以替代的价值。先看部署效率,在需要毫米级精度和实时力度调整的任务中,VLA的轻量化架构更容易实现实时部署。再看工程成熟度,VLA经过一年多的快速发展,模型架构已经相当成熟,生态工具也比较完善。还有一个容易被忽视的维度:与现有工业体系的兼容性,VLA的模仿学习范式与工业场景的需求天然契合。

所以,更可能发生的演进路径不是“VLA被淘汰”,而是两者的深度融合。“VLA已死”更像是一声警钟,提醒行业思考如何将物理理解的能力融入现有框架。

半年一变天,创业公司正在承压

从VLA的崛起到被质疑“已死”,中间不过半年多的时间。对于资源有限的初创企业而言,每一次“变天”都可能是一场需要重新押注的赌局。

这一切的起点,首先是研发路线上巨大的沉没成本风险。过去一年,大量初创企业围绕VLA构建技术栈,投入重金采购遥操作设备,组建专门的数据采集团队。自变量机器人在2023年底成立后,先后完成了B轮近20亿元融资,累计融资超过40亿元,其中相当一部分用于数据采集工厂建设和真机数据采集团队搭建。智平方在一年内完成12轮融资,累计融资金额超过10亿元,其自建产线于2025年9月投产,同年12月实现单月百台级AlphaBot 2交付。当WAM的浪潮袭来,这些投入的价值正在被重新评估。

技术路线的切换很快在人才市场上引发了连锁反应。VLA时代和WAM时代对人才技能组合的需求不同,技能组合的快速变化,让创业公司刚刚建立起来的团队结构面临重构压力。并且,技术路线的快速切换意味着人才市场的供需关系也在剧烈波动,WAM方向变得热门的同时,相关人才的溢价也在迅速攀升,而原本高薪聘请的VLA团队则面临流失或转型的双重困境。《脉脉2026春招职场洞察报告》显示,2026年1至4月,具身智能岗位量同比暴增15倍,平均月薪从5.9万元升至6.2万元。有从业人员透露,行业跳槽薪资涨幅可高达150%。

比人才问题更直接的,是产品价值的存疑。当技术路线半年一变,之前基于旧路线开发的产品可能突然就失去了市场价值。比如,那些基于VLA范式、依赖遥操作数据训练出来的机器人技能模型,在WAM的叙事下面临重新估值。

而所有这些问题,最终都会反馈到资本市场上。2026年《中国投资发展报告》指出,人形机器人产业投资正进入“去伪存真”的关键阶段,估值逻辑正从概念炒作转向订单验证与供应链卡位。在技术路线还在剧烈变动的阶段,投资人对故事的容忍度正在快速下降。对于创业公司而言,这意味着融资要同时证明自己的方向判断力和执行韧性。

回过头看,“VLA已死”未必是事实,但它确实是一记警钟。在这个行业,选对方向比埋头苦干重要得多。而选对方向的窗口期,正在变得越来越短。对于创业公司来说,这意味着必须在专注和灵活之间找到微妙的平衡;对于投资人来说,这意味着需要更加审慎地评估技术路线的可持续性,避免追逐短期的叙事热点。机器人产业还处在早期阶段,技术路线远未收敛。今天的主流,明天可能就变成历史。WAM的崛起是真实的,VLA的价值也不会轻易消失。

http://www.jsqmd.com/news/860030/

相关文章:

  • 第八篇:《软件测试的经济学:投入与回报》
  • UE5-MCP:模块化代码流水线与AI驱动的开发提效方案
  • 【仅限VIP订阅者解锁】:Midjourney毛玻璃效果私有LoRA微调包+12组经生产验证的prompt模板(含Figma交付规范)
  • 摒弃花架子!工业数智化落地的核心底座与三条实战路径
  • 为 AI 智能体项目选择模型,Taotoken 模型广场的选型与接入思路
  • 铁路机车再生制动能量智能利用系统与关键技术【附程序】
  • 伺服电机电流环PI参数整定:从数学模型到工程实践
  • TMS320VC5502PGF300:TI TMS320C55x系列定点DSP,300MHz,176-LQFP封装
  • 制造业数智化转型落地新思路:AI不是炫技,是解决实际生产痛点
  • 从字节码分析:try-with-resources 与 try-catch-finally 的区别
  • 七、Linux系统下的文件IO (一)
  • ofox.ai 无法访问?解决方法在这里(最新)
  • 从零开始:Java原生连接RabbitMQ完整流程(个人学习笔记001)
  • 从黑盒到透明:ReAct推理如何重塑企业AI智能问数能力
  • Red Hat Enterprise Linux 10.2 和 9.8 发布,命令行 AI 辅助增强,多工具集性能升级
  • iFakeLocation完全指南:如何在3分钟内实现iOS设备虚拟定位
  • 仅限本周开放|Lovable高阶工程化实践内部培训课件(含模块化架构图、依赖注入容器源码注释版)
  • 本源投影内生智能:从概率拟合到硅基生命的底层重构
  • 面试 AI Agent 工程师会被问什么?40+ 真题 + 知识图谱全梳理
  • 老挝语TTS项目上线倒计时72小时?ElevenLabs老挝文语音集成故障排查手册,97.3%错误可5分钟定位
  • BOXER-6646-ADP嵌入式AI平台:机场eGate自动通关系统的工业级智慧大脑
  • 照着用就行:盘点2026年顶尖配置的的降AIGC软件
  • 【2026推荐榜】西安黄金回收上门最快是哪家?七家时效对比,金晨金包银排名第一 - 西安知道
  • RT-Thread软定时器精度优化:从原理到实战解决物联网设备定时漂移
  • RK3568国产工业级车载方案:从核心板设计到量产落地的全流程解析
  • vLLM--连续批处理(Continuous Batching)
  • Adobe GenP 3.0:终极Adobe全家桶破解工具使用指南
  • Midjourney阿盖洛印相实战手册(从暗房哲学到AI指令映射):12个被官方文档刻意隐藏的--stylize与--chaos协同公式
  • 【2026推荐榜】西安黄金回收哪家价格高?七家实体店横向对比,金晨金包银稳居榜首 - 西安知道
  • 马斯克预测10年后90%行驶里程由AI完成,自动驾驶是吹牛还是大势所趋?