当前位置：首页 > news >正文

加州DMV自动驾驶测试报告深度解析：技术进展、局限与行业真相

news 2026/7/3 14:13:30

1. 从加州DMV数据看自动驾驶的“成绩单”：进步、局限与行业真相

又到了每年一度“开盲盒”的时候。我说的不是别的，正是加州车辆管理局（DMV）发布的年度自动驾驶汽车测试数据报告。对于像我这样在汽车电子和智能驾驶领域摸爬滚打了十几年的从业者来说，这份报告就像一份行业“期中考试成绩单”，虽然不能完全代表一个学生的全部能力，但总能从中窥见一些趋势、亮点和值得深思的问题。2021年2月发布的这份涵盖2019年12月至2020年11月的数据，尤其特殊，因为它完整记录了一个被疫情深刻改变的年份。数据里既有令人振奋的进步——比如整体“脱离”频率的大幅提升，也暴露了这个衡量体系固有的缺陷，以及数据背后那些未被充分讲述的故事。今天，我们就抛开新闻稿式的乐观，结合一线研发的经验，来深度拆解这份数据，看看它到底告诉了我们什么，又隐瞒了什么。

这份数据的核心很简单：各家公司在加州公共道路上跑了多少测试里程，动用了多少辆车，以及发生了多少次“脱离”。所谓“脱离”，就是安全驾驶员接管车辆控制权的时刻，无论是系统主动请求，还是驾驶员判断系统无法处理当前局面而主动干预。这个“平均每次脱离行驶里程”的指标，成了业界和媒体比较公司技术水平的“标尺”。但我们必须清醒地认识到，这只是一把刻度模糊、甚至可能失准的尺子。它衡量的是系统在特定测试环境和策略下“不犯错”的间隔，而非系统处理复杂场景的真正能力。不过，在缺乏其他更全面、更透明的数据之前，这份来自监管机构的报告，仍然是我们观察这个高度保密行业为数不多的公开窗口。

2. 核心数据深度解析：数字背后的行业图景

2.1 2020年全景：疫情下的收缩与分化

先来看整体大盘。2020年，在加州进行实际路测的公司从2019年的36家减少到29家。更有意思的是，有34家持有测试许可的公司全年“零里程”测试。这本身就说明了问题：自动驾驶的淘金热正在退潮，资源向头部玩家集中，许多公司或许转向了成本更低的模拟测试，或者干脆收缩了战线。

总测试里程约200万英里，比2019年下降了31%。这毫无疑问是疫情的直接后果。去年三四月份，许多公司的测试车队几乎停摆。但值得注意的是，总测试车辆数反而微增了4.3%，达到507辆。这说明头部公司仍在持续投入和扩张车队规模，为后续的规模化运营做准备。一个关键细节是，Waymo和Apple分别有95辆和40辆持有许可的车队车辆未被使用，这暗示了从“测试验证”到“商业运营”的过渡中，车队管理和部署策略的复杂性。

最引人注目的数据是“脱离”总数的锐减：从2019年的9344次下降到2020年的3736次。这使得平均每次脱离行驶里程从308英里大幅提升至535英里，增幅超过73%。这无疑是技术进步最直观的体现。但这里有一个重要的背景不能忽略：2020年加州的道路交通状况因疫情而变得异常“友好”，车流量减少，行人稀少，突发复杂场景的概率降低。这种“简单模式”是否在一定程度上“美化”了成绩单？这是我们在解读时必须打上的一个问号。

2.2 头部玩家对决：Cruise与Waymo的里程竞赛

测试里程的榜首首次易主。通用汽车旗下的Cruise以77万英里的里程超越了Waymo的62.9万英里，登顶第一。Waymo自2015年DMV开始报告数据以来，一直是这个项目的领跑者，此次被超越是一个标志性事件。Cruise在疫情期间利用自动驾驶车辆为食物银行提供配送服务，保证了测试的连续性，而Waymo则在去年四五月份出现了测试里程的断层。

注意：测试里程的绝对数值固然重要，但测试场景的质量和多样性更为关键。在空旷街道上积累一百万英里，其价值可能远不如在旧金山闹市区积累的十万英里。DMV的数据并未区分道路类型和复杂度，这是其一大局限。

除了这两家，只有两家公司测试里程超过10万英里：中国的Pony.ai（小马智行）达到22.5万英里，同比增长29%；亚马逊旗下的Zoox达到10.2万英里，同比增长53%。这表明，即使在疫情和资本寒冬下，真正的实力玩家仍在坚定地推进路测，为未来的商业化储备真实的corner case（极端案例）数据。

2.3 “脱离”率排行榜：谁的技术更“丝滑”？

如果说测试里程是“用功程度”，那么平均每次脱离行驶里程就是“考试成绩”。2020年，头部公司的成绩单非常亮眼：

Waymo: 接近30,000英里/次脱离，相比2019年提升超过126%。
Cruise: 超过28,500英里/次脱离，提升超过133%。
AutoX（安途）: 超过20,400英里/次脱离，提升超过90%。

Waymo和Cruise双双进入“2万英里俱乐部”，并且年增长率都超过100%，这体现了其软件算法在迭代中的巨大飞跃。AutoX作为第三名，也展示了强大的技术稳定性。紧随其后的是Pony.ai（约10,700英里）和首次在加州进行测试的Argo.ai（约10,500英里），它们构成了“1万英里俱乐部”。

然而，榜单的另一端则揭示了行业的巨大鸿沟。剩下的19家公司，平均每次脱离行驶里程从不足1英里到474英里不等。这意味着有些公司的系统在公共道路上几乎无法连续稳定运行几分钟。这种两极分化清晰地表明，自动驾驶的技术壁垒极高，已经形成了明显的梯队。

实操心得：在评估这类数据时，不要只看排名和数字。要关注趋势。一家公司从50英里/次脱离提升到500英里，其进步可能比一家从10000英里提升到15000英里的公司更具技术突破性。因为前期解决基础感知和规控问题带来的提升是巨大的，而后期打磨长尾问题则更为艰难。

3. 数据背后的技术逻辑与测试策略拆解

3.1 “脱离”作为指标的局限性：我们到底在衡量什么？

业界共识是，“脱离”是一个有缺陷的指标。它为什么有缺陷？从一线开发的角度看，原因至少有四：

触发标准主观：“脱离”触发依赖于安全驾驶员的判断。一个经验丰富、警惕性高的驾驶员可能会在系统表现稍有迟疑时就接管，而一个更“宽容”或疲惫的驾驶员可能会让系统在非最优状态下运行更久。这导致了数据在不同公司、甚至不同驾驶员之间的可比性下降。
未区分脱离原因：系统因感知到前方施工锥桶而礼貌请求接管，与系统因无法识别静止障碍物而即将发生碰撞被紧急接管，性质天差地别。前者可能是功能边界的设计，后者则是严重的技术缺陷。DMV的报告并未要求对脱离原因进行分级分类。
测试场景选择性：公司可以选择在路况简单的郊区、天气良好的时段进行测试，从而“刷高”里程。这无法反映系统在雨雪天气、夜间、复杂市中心等挑战性场景下的真实能力。
软件版本与OTA：现代自动驾驶系统支持在线升级。一次重大的OTA更新后，系统性能可能跃升。年度数据是一个“混合平均值”，无法反映其最新版本的真实水平。

因此，将“平均每次脱离行驶里程”直接等同于“自动驾驶技术水平”是危险的。它更像一个“系统在特定测试规程下的稳定性指数”。

3.2 模拟测试与真实路测的“双轮驱动”

报告中提到了Aurora，这家公司因为主要依靠仿真模拟来提升系统能力，而未将其纳入趋势分析表格。这恰恰点出了当前行业的核心方法论：仿真模拟与真实路测的结合。

真实路测：价值在于收集真实世界不可预知的“长尾分布”数据，尤其是传感器原始数据。这些数据是训练和验证AI模型的基石。它的缺点是成本极高（车辆、安全员、保险）、效率低（遇到一个罕见场景可能要等很久），且存在安全风险。
仿真模拟：可以在云端创建海量、多样、极端的驾驶场景，以极低的成本和零风险进行百万、千万英里的测试。它可以快速验证算法修改的效果，并主动“攻击”系统的薄弱环节。

成熟的自动驾驶公司，无一不是“两条腿走路”。他们会将真实路测中遇到的棘手案例（即导致脱离的场景）进行精细化标注，然后放入仿真引擎中，生成成千上万个变体（如改变天气、光照、交通参与者行为）进行回归测试，确保问题被彻底解决。因此，只看公开路测里程，会严重低估像Aurora这类在仿真技术上重兵投入的公司的实际进展。

3.3 中国公司的亮眼表现与背后的逻辑

在排行榜中，AutoX、Pony.ai、WeRide（文远知行）、DiDi等中国背景的公司表现十分突出。这并非偶然，其背后有深刻的产业逻辑：

场景驱动：中国拥有全球最复杂、最动态的城市交通环境（如混合交通流、随机性强的行人电瓶车等）。在这种“地狱难度”下打磨出的算法，其泛化能力和鲁棒性往往更强。当这些公司将在国内积累的技术和经验，应用到交通法规相对清晰、驾驶行为更可预测的加州道路上时，容易取得较好的数据表现。
技术路径：许多中国公司采取了以激光雷达（LiDAR）为主的多传感器融合方案，在感知的准确性和冗余度上起点较高。这有助于减少因感知不确定性导致的脱离。
资本与人才：前几年中国自动驾驶领域获得了巨额融资，吸引了全球顶尖人才，使得这些公司有能力在海外设立研发和测试中心，直接参与全球竞争。

4. 从数据到商业化的鸿沟：我们离真正的自动驾驶还有多远？

4.1 脱离率与可商用化的关系

一个经常被问到的问题是：平均每次脱离行驶里程达到多少，才能推出商业化的Robotaxi服务？这是一个没有标准答案的问题，因为它不仅关乎技术，更关乎安全哲学、法规和公众接受度。

从技术角度看，脱离率需要降低到比人类驾驶员事故率低几个数量级，才能证明其安全性。人类驾驶员在美国的平均事故率大约在每50万英里发生一次。如果自动驾驶的“脱离”等同于一次潜在的事故风险，那么Waymo和Cruise接近3万英里的水平，似乎离这个目标还有距离。但如前所述，并非所有脱离都指向事故。

更务实的看法是，商业化初期并不追求“零脱离”，而是追求“可管理的脱离”。即在限定区域（ODD，设计运行域）内，系统能处理绝大多数场景，极少数的脱离由远程安全员或车内安全员平稳接管，且接管的体验足够“无感”，不影响乘客体验。Waymo在凤凰城、Cruise在旧金山的有限区域收费运营，正是基于这种思路。它们的目标不是一步到位实现L5，而是在一个边界清晰的L4领域内提供可靠服务。

4.2 数据未覆盖的“隐形冠军”与不同技术路线

加州DMV的数据只是一个切片，它遗漏了许多重要的玩家和技术路线：

特斯拉：特斯拉的Autopilot和FSD系统通过全球数百万辆量产车收集数据，其测试里程和场景丰富度远超任何一家在加州进行路测的公司。但特斯拉不向DMV提交脱离报告，因为其系统被定义为L2级辅助驾驶，始终需要驾驶员监管。它的进步体现在软件版本的迭代和用户端体验的改善上，是另一种完全不同的技术发展和数据收集范式。
Mobileye：作为自动驾驶视觉方案的领导者，Mobileye同样拥有海量的量产车数据。其策略是通过“众包”高精地图和REM系统，以及逐步升级的芯片与算法，最终实现L4。它的测试数据也未被包含在DMV报告中。
专注于特定场景的公司：例如Nuro（无人配送车）、Gatik（中途物流）等。它们的车辆运行在相对固定的路线上，场景复杂度较低，其技术成熟度和商业化进度可能更高，但DMV的通用测试数据难以完全体现其价值。

4.3 给从业者和观察者的建议：如何正确利用这份报告？

对于行业内的工程师、投资者和研究者，面对这份年度报告，我的建议是：

看趋势，而非单点：重点关注一家公司连续多年的数据变化。是持续改善，还是波动停滞？Waymo从2015年的约1200英里提升到2020年的近3万英里，这条平滑向上的曲线比某个年份的排名更有说服力。
结合其他信息源：将DMV数据与公司的技术发布会、专利申报、人才招聘动向、合作伙伴关系等结合起来看。例如，一家公司如果同时宣布了新一代传感器方案和扩大测试区域，即使其脱离率暂时不是最高，也可能正处于技术突破的前夜。
理解数字背后的测试策略：尝试了解各公司的测试重点区域（是旧金山市区还是硅谷郊区？）、测试时间（是否回避高峰和夜间？）。这些信息有时能从公司的公开报道或招聘地点中推断出来。
关注“质”的指标：虽然DMV不提供，但可以留意行业报告中关于“接管严重性”、“无干预行程占比”等更细致的分析。有些第三方研究机构或媒体会尝试进行更深入的解读。

自动驾驶是一场马拉松，而不是百米冲刺。加州DMV的年度报告，就像沿途设置的几个计时点。它告诉我们选手们目前的位置和配速，但无法预测谁最终能克服“长尾问题”这座大山，安全、可靠、规模化地跑到终点。对于所有参与者而言，保持对技术的敬畏，对安全的执着，以及对商业规律的尊重，才是穿越周期、抵达未来的不二法门。

查看全文

http://www.jsqmd.com/news/807687/