当前位置: 首页 > news >正文

拆解小米智驾的“兵团”:1800人、70亿和四位掌舵者

拆解小米智驾的“兵团”:1800人、70亿和四位掌舵者

关键词:小米汽车、智驾、叶航军、陈光、陈龙、王乃岩、端到端、VLA、玄戒芯片、澎湃OS

楔子:一款“期货智驾”的逆袭路

2024年3月SU7发布时,不少人对小米的智驾能力持怀疑态度。“期货智驾”“体验如何等到推送再看”的议论此起彼伏。

将近两年过去,同样一批人开始认真对待这个后来的追赶者:从2025年初仅支持高速NOA,到2025年底端到端全场景智驾实现全国337城覆盖、复杂路口通过率98.6%,小米用三次底层大版本迭代,走完了同行花5到10年才走完的路。

支撑这种速度的,是背后逾1800人的智驾团队——其中博士达108人;是2025年超过70亿元的AI领域研发投入;更是一套在雷军“压强式投入”策略下构建起来的组织与人才架构。

雷军在2025年广州车展上亲自站台介绍智驾团队的四位核心成员:叶航军总体负责,陈光负责端到端,陈龙负责VLA,王乃岩负责L3项目。这是小米少见的让技术负责人走向台前的时刻。四位掌舵者各有分工,而他们的履历组合暗示的,是小米在智驾这件事上的底层打法:挖团队而非挖个体,用成熟经验换速度

一、核心分工与背景概览

姓名核心职能方向关键标签与经验背景
叶航军总负责人,智驾体系搭建者清华博士,前谷歌美国总部工程师,小米“十七罗汉”之一,前集团技术委员会主席
陈光端到端技术负责人前百度Apollo美国感知负责人,一汽南京研究院CTO,主导红旗L4级Robotaxi
陈龙VLA负责人前英国Wayve主任科学家,MIT TR35入选者,自动驾驶可解释性技术开创者
王乃岩L3项目负责人香港科大博士,前图森未来中国CTO,论文引用超25000次,深度学习权威

视角解读:四位核心成员无一例外都是“空降兵”,但并非零散挖角。他们的背景形成了清晰的年龄梯队与技术代际互补——70后的叶航军负责整体架构与资源调度,之后三人分别掌握端到端量产、VLA前沿预研和L4/L3两种技术高度。再加上背后来自宝马、法拉利、劳斯莱斯等传统豪华车企的整车研发力量,以及北京、上海、武汉、德国慕尼黑的全球研发布局,小米汽车这套兵团式打法,正在把“后发追平”变成一种可复制的组织能力。

二、四位操盘手:谁在掌舵这艘智驾快船

1. 叶航军:十七罗汉中的技术底盘

“官宣造车当晚,技术委员会主席叶航军就被确定为智驾总体负责人。”作为小米创始时期“十七罗汉”之一,叶航军的履历相当扎实:2003年从清华计算机系博士毕业,研究方向是计算机视觉与图像检索,之后先后就职于谷歌北京、谷歌美国,参与过著名搜索引擎“咖啡因”的开发。2010年加入腾讯担任搜索团队技术总监,2012年加入小米后,一手搭建了小米的AI与智驾体系。

相比另外三位一线带队冲锋的技术专家,叶航军的角色更像是智驾体系的总设计师。他需要回答的问题不是某一条算法Pipeline的细节,而是:1800多人的团队在三条技术路线并行推演的时候,谁负责量产落地、谁做方向预研、谁死磕L3准入——以及,钱和GPU先给谁。

2. 陈光:砸碎技术焦虑的“工程派”

陈光是小米智驾量产能力的具象化身。从美国密苏里大学毕业后,他先后在百度Apollo美国研发中心做感知技术负责人、一汽南京研究院任CTO,主导了红旗第三代L4级Robotaxi的开发。从硅谷到长春再到北京,这段轨迹让他在算法与量产工程之间找到了一种务实平衡。

在2025年底的专访中,陈光说了一句值得行业反思的话:“我们不想制造技术焦虑了。”面对行业里VA、WA、VLA等名词混战,他的立场很鲜明:小米面对技术路线选择从不“一刀切”,无论是VA、WA还是VLA,本质上都是如何让模型的“智能密度”最大;技术先进与否并不代表体验更好,最终能否被用户感知到、被信任、长期使用,才是判断标准。

他的职责是从众多技术选项中挑出当下最值得全力推进的那一两条,同时确保其他方向有人在同步探路。在一个“没创新就被淘汰、太激进就可能翻船”的战场上,这种分寸感就是核心能力。

3. 陈龙:VLA与可解释性的布道者

如果说陈光是小米智驾的“当下保证”,陈龙就是负责“探索未来”的那一个。今年35岁的陈龙出身于英国AI独角兽公司Wayve,这家公司以“纯视觉端到端自动驾驶”闻名全球。他是《麻省理工科技评论》亚太区“35岁以下创新35人”,专注自动驾驶可解释性技术。

招揽陈龙回国的过程中,雷军亲自出面邀谈,摆足了诚意。在行业里绝大多数玩家争相用开源基座模型快速搭建VLA方案时,陈龙坚持小米要走差异化路径——从零开始构建“自研具身基座模型”,从LLM预训练阶段就精心筛选数据,融入驾驶场景与机器人的专项训练。

VLA在他的定义中是“通往L3/L4级智能驾驶的必要条件”。相比传统端到端模型在决策上的“黑盒推理”,VLA通过语言模态赋予了系统更强的可解释性——不仅能告诉用户“系统在做什么”,还能传达“为什么这么做”。这种可解释性,恰恰是端到端智能驾驶从“能用”真正走向“敢让用户放心托管”的关键。

4. 王乃岩:L3准入的攻坚手

王乃岩是这支队伍里“最年轻的老资格”。从香港科技大学博士毕业以来,他深耕深度学习在目标追踪领域的应用,论文被引用超25000次。加入小米前,他在图森未来担任中国CTO,负责L2辅助驾驶与L4自动驾驶系统的并行研发。

他的任务是L3项目。这意味着他要应对的不仅是算法精度,更是整套法规准入验证流程:功能安全边界如何定义,系统失效后的人机接管链路如何设计,极端场景的长尾验证需要跑多少公里才够安全——这些是算法团队通常不碰但在L3级别逃避不了的问题。

三、智驾技术路线:不站队,全都要

追平速度:从2024到2025

相比理想、蔚来和小鹏,小米启动端到端研发的时间最晚,但追赶速度极快。2024年才正式成立“端到端算法与功能部”,理想和蔚来早已领先至少3个月。

然而接下来一年,小米的迭代节奏反超大多数对手:2025年2月推送300万Clips端到端系统,7月升级至1000万Clips版本;11月再度发布Xiaomi HAD增强版,在端到端架构中加入世界模型和强化学习。陈光的解读是,“模型不仅要知道怎么模仿老司机开车,更要理解‘为什么’这样开”。

多次系统迭代带来了数据闭环的加速——截至2025年底,小米智驾活跃用户达47.3万人,累计行驶里程突破3亿公里,成功避免潜在碰撞45.7万次,泊车辅助功能被使用超过3096万次。

多元路线:不站队也是一种战略

进入2026年,中国智驾行业在技术路线上出现明显分歧:理想坚定转舵VLA(视觉-语言-行动),华为坚持WA(世界行为模型),小鹏则是混合策略“VLA+端到端”。

小米采取的策略与众不同——不站队。智能驾驶团队三条并行的路径如下:

  • 端到端+世界模型+强化学习(陈光负责):这是量产主路线,已完成第三次大规模版本推送;
  • VLA(陈龙负责):方向维度的预研,以自研具身基座模型为核心差异化王牌;
  • WA、VA等所有主流路线预研(也由陈光统筹管理):市面上所有已知路线,小米内部都有团队在同步探索。

不赌单一技术路径,用并行预研换取方向切换的冗余性,这套打法的背后逻辑并不难理解:智驾仍在快速演化阶段,今天的信息壁垒不足以让人做出终局判断。在通往L3/L4的漫长征途上,“方向押错,满盘皆输”不是夸张的说法。对小鹏、理想、华为来说,技术路线就是品牌特色的一部分;对小米而言,灵活性才是核心KPI。

四、软硬件纵深:芯片、OS与生态协同

小米智驾的护城河,不止于算法。

自研芯片上车:2026年一季度传来的消息,采用3nm先进制程的玄戒O2芯片将搭载至小米汽车,全新一代澎湃OS将与自研智驾算法在芯片层实现深度融合,显著降低对高通等外部供应商的依赖。凭借自研芯片打造的“芯片-终端-场景”全链路,小米正在向苹果和特斯拉的垂直整合模式靠拢。

2026“三位一体大会师”:2026年1月,雷军在小米年度技术大奖颁奖典礼上释放了更强信号:2026年将在一款终端上实现自研芯片、自研OS、自研AI大模型的“三位一体大会师”。量产落地的首站,极大概率是新一代小米SU7。

“人车家全生态”的差异化:小米在全球拥有超过8.6亿台连接终端,从手机、汽车到智能家居全覆盖。这个生态壁垒意味着什么?每天翻涌的驾驶场景数据,可以反哺AI模型迭代进化;车内语音交互与家庭智能设备无缝联动;一辆车的智驾表现,可以在全球多个场景的传感器阵列中产生复利效应。这种“数据-算法-场景”的闭环,是纯自动驾驶公司难以企及的护城河。

五、从追赶到超越,小米还有哪些隐忧?

技术与生态上的诸多筹码,不代表小米智驾已高枕无忧。

头部玩家分化日趋激烈:在2026年P3发布的辅助驾驶实测排行榜上,华为ADS V4.1以4.46分三连冠,小鹏NGP 2.0以4.33分紧随其后。小米以端到端技术路线虽已追平行业,但想在复杂城市博弈和高阶安全冗余上超越华为、小鹏等先行者,仍有大量工程细节需要精雕细琢。

用户信任需要时间沉淀:也有用户的真实反馈值得正视——高速NOA省心靠谱,但切换到老城区狭窄街道,系统依然容易因感知置信度不足而频繁退出。一些长期测试车主评价:“智驾能用,但不敢用,不知道它什么时候会‘抽风’。”大量算法精度的提升,最终要转化为用户“敢放手”的信心,不是靠技术发布会就能一步到位的。

团队稳定性的考验:1800人团队、超过70亿年投入的高强度运转模式,能否持续保持迭代速率和组织稳定,本身就是一场压力测试。

六、总结:小米智驾,为什么不是“又一个入场者”

在新能源造车已进入“淘汰赛”的当下,小米智驾给出的是不同于任何历史玩家的路径:

  • 组织力上,“挖团队”而非“挖个体”的快速整合打法,让一个1860人的全功能技术矩阵在短短两年内投入实战——这种组建效率和执行力,带有鲜明的雷军系烙印;
  • 技术选择上,“不站队、全面预研”的多线并行策略,既保证当下量产主路不偏移,又为架构升级和L3/L4的跃迁留有纵深;
  • 生态纵深上,“自研芯片澎湃OS+人车家全生态”,把小米十几年消费电子积累的平台优势完整迁移到智驾主战场。

在智能驾驶这场长跑中,小米真正的壁垒不是某一套当前最强的算法,而是“快速追平+持续反超”的组织基因。当算法红利逐步消退,决定终局的,往往是能否在人才密度、资金强度、技术路线和生态协同之间,踩出属于自己的独特节奏。

http://www.jsqmd.com/news/690845/

相关文章:

  • 用Arduino模拟AB相编码器信号:低成本测试PLC程序的3种方法
  • Python自动化实战:基于pyautocad的高效CAD处理方案
  • 嵌入式C程序员最后的护城河:当大模型开始生成驱动代码,这7个不可绕过的硬件感知编程范式决定你是否会被淘汰?
  • 告别刮削卡顿!我的Emby媒体库刮削优化方案:从云端到本地的迁移实践
  • 告别全局update!手把手教你构建安全的UVM寄存器批量更新函数
  • 手把手教你用免费插件搞定Grafana连接Oracle数据库(附SpringBoot后端源码)
  • 永磁同步电机谐波抑制实战:多同步旋转坐标系下五七次谐波电流的闭环抑制策略
  • cc-sdd部署指南:从本地开发到生产环境的完整配置
  • 路灯控制器能不能单独控制某一盏灯,能不能分组控制、集中管理?
  • 别再手动复制粘贴了!用Matlab的fscanf函数5分钟搞定杂乱文本数据导入
  • ROS2架构演进与DDS核心:从实验室原型到工业级机器人系统的通信革命
  • iOS逆向入门:手把手教你解包、修改info.plist并重签名(实战Pikachu靶场App)
  • 【限时开放】CUDA 13 AI算子性能诊断工具集(含Nsight Compute深度trace模板、PTX反编译校验脚本、Hopper专属occupancy计算器):仅剩最后87个企业授权名额
  • Win10/Win11系统下,用VSCode编译Betaflight固件最全避坑指南(从GCC安装到HEX生成)
  • Docker 27集群负载均衡实操手册:从零部署高可用服务网格,5步完成健康检查+会话保持+权重调度
  • 别再手动算频谱了!手把手教你用STM32CubeMX+DSP库搞定FFT(附源码避坑)
  • 从JSSC经典论文到动手仿真:我是如何用Verilog-A复现1984年那款15位SAR ADC的
  • 开发者数字分身:AI职业代理
  • 【优化求解】不同发动机和燃料对GA应用进行价格调整建模Matlab实现
  • 为什么你的C++ MCP网关CPU利用率超85%却只跑出1/3理论吞吐?——揭秘LLVM 18.1向量化编译器未启用的3个关键开关
  • Flutter项目编译报502?手把手教你用阿里云镜像替换jcenter,5分钟搞定依赖下载
  • 如何在5分钟内用League-Toolkit打造终极英雄联盟智能助手
  • Ubuntu 16.04下搞定SPDK安装:从Python版本冲突到HugePages配置的完整避坑实录
  • 【中等】出现次数的TOPK问题-Java:原问题
  • BEVFusion复现实战:从环境搭建到模型训练的关键报错与解决
  • node-imap 与 OAuth 认证集成:安全连接的最佳实现方案
  • STM8S项目创建后,除了main.c你还应该关注什么?详解stm8_interrupt_vector.c
  • 从《最终幻想》到你的项目:用Unity URP+面片方案,低成本搞定游戏角色头发渲染
  • Linux运维实战:命令行高效管理OSS对象存储
  • Raspberry Pi 5与Intel N100迷你PC全面对比:2023年硬件选型指南