当前位置: 首页 > news >正文

为什么现在大家搞 Anchor Trajectory、Diffusion Policy、World Model,而不是直接像传统规划一样撒一堆 Reeds-Shepp / Dubins 曲线,然后挑一

有个疑问:为什么现在大家搞 Anchor Trajectory、Diffusion Policy、World Model,而不是直接像传统规划一样撒一堆 Reeds-Shepp / Dubins 曲线,然后挑一条最优的?

传统撒点规划解决的是“可行轨迹搜索”问题,而扩散模型解决的是“驾驶行为分布建模”问题。

这是一个很好的问题。实际上你是在问:

为什么现在大家搞 Anchor Trajectory、Diffusion Policy、World Model,而不是直接像传统规划一样撒一堆 Reeds-Shepp / Dubins 曲线,然后挑一条最优的?

答案是:

传统撒点规划解决的是“可行轨迹搜索”问题,而扩散模型解决的是“驾驶行为分布建模”问题。

两者目标其实不一样。


Question.1 Reeds-Shepp 本质在干什么

RS曲线解决的是:

给定

  • 起点姿态
  • 终点姿态

求:

min ⁡ L \min LminL

满足:

∣ κ ∣ ≤ κ m a x |\kappa| \le \kappa_{max}κκmax

即:

最短可行路径问题

例如:

停车位 | | | ego

RS会产生:

左转 右转 倒车 前进

组合路径。


它不考虑:

  • 行人
  • 其他车辆
  • 红绿灯
  • 驾驶习惯
  • 社会交互

只考虑:

我的车能不能从A到B


Question.2 为什么自动驾驶不能只靠RS

假设路口:

Car B ↓ Car A → Ego

RS会得到:

方案1: 直接穿过去 方案2: 轻微绕行 方案3: 停车等待

从几何角度:

三条都合法。


但真正驾驶员会:

等Car B先走

原因是:

社会规则。


而:

RS不知道社会规则。

它只知道:

path_length curvature

所以:

RS生成的是:

p ( p a t h ∣ s t a r t , e n d ) p(path|start,end)p(pathstart,end)

而驾驶需要:

p ( p a t h ∣ s c e n e ) p(path|scene)p(pathscene)

这完全不是一个东西。


Question.3 Anchor Trajectory在干什么

例如4096个轨迹:

直行 左变道 右变道 减速 停车 让行 ...

实际上是在学习:

p ( τ ∣ s c e n e ) p(\tau|scene)p(τscene)

其中:

τ = t r a j e c t o r y \tau = trajectoryτ=trajectory

网络输出:

轨迹1 0.5 轨迹2 0.3 轨迹3 0.1 ...

这相当于:

未来驾驶行为词典

而不是:

几何路径词典

Question.4 Diffusion 为什么又比 Anchor 强

Anchor有一个问题:

词汇表有限。

例如:

4096条

覆盖不了所有情况。


扩散模型直接学习:

p ( τ ) p(\tau)p(τ)

或者:

p ( τ ∣ s c e n e ) p(\tau|scene)p(τscene)

不需要离散化。


训练:

真实轨迹 ↓ 加噪声 ↓ 学习去噪

推理:

高斯噪声 ↓ 迭代去噪 ↓ 轨迹

得到:

左绕 右绕 等待 缓慢通过

多个模式。

因此天然是:

连续空间多模态采样器。


Question.5 那扩散和RS的关系是什么

其实非常接近:

都在采样轨迹。

区别:

RS采样的是:

运动学可行轨迹

扩散采样的是:

人类驾驶轨迹

RS:

p ( τ ∣ v e h i c l e ) p(\tau|vehicle)p(τvehicle)

Diffusion:

p ( τ ∣ v e h i c l e , s c e n e , h u m a n ) p(\tau|vehicle,scene,human)p(τvehicle,scene,human)


Question.6 能不能直接撒很多RS曲线

当然可以。

很多系统就是这么干的。

例如:

  • Hybrid A*
  • State Lattice
  • EM Planner
  • Apollo Planning

都是:

撒轨迹 ↓ 打分 ↓ 选最优

例如:

5000条RS轨迹

完全没问题。


但问题来了:

如果是复杂交互:

行人突然穿行 前车礼让 路口博弈

需要撒多少?

可能:

50万条 500万条

才能覆盖。


搜索空间爆炸。


Question.7 扩散其实是在学习“如何撒点”

这是最核心的一点。

传统:

随机撒

或者:

规则撒
RS1 RS2 RS3 ... RS50000

扩散:

直接学:

人类会撒在哪里

然后只生成:

几十条 几百条

高概率轨迹。


相当于:

暴力搜索

变成

学习引导搜索

Question.8 RL + RS 能不能替代轨迹规划

严格说:

RL + RS 仍然属于轨迹规划。

例如:

RS生成1000条候选 ↓ RL网络评分 ↓ 选择最佳

这叫:

Learning-based Planner

或者:

RL-guided Planning


它没有消灭规划。

只是把:

Cost Function

变成:

Neural Network

Question.9 为什么现在大量论文用 Diffusion + RL

因为Diffusion和RL分工明确:

Diffusion负责:

Generate

生成合理候选轨迹。


RL负责:

Evaluate

评估长期收益。


流程:

Scene ↓ Diffusion ↓ 20条高质量轨迹 ↓ RL Value Network ↓ 选择最优

而不是:

Scene ↓ 50万条RS ↓ 搜索

计算量小很多。


从自动驾驶发展的角度看:

  • Dubins / Reeds-Shepp:解决“车能不能这么走”。
  • Hybrid A*:解决“怎么搜索可行轨迹”。
  • Anchor Trajectory:解决“人通常会怎么走”。
  • Diffusion Policy:解决“连续空间里可能怎么走”。
  • RL:解决“长期来看哪条轨迹收益最高”。

因此RL + RS 并不会让轨迹规划消失,它更像是“传统规划 + 学习评分器”;而 Diffusion 想做的是直接学习轨迹分布,把大量无意义的 RS 搜索提前过滤掉。

http://www.jsqmd.com/news/960892/

相关文章:

  • 别再手动下载了!教你用GeoServer+OSM数据快速搭建自己的离线地图服务(Windows环境)
  • 湛江黄金回收品牌合集六家靠谱门店详细盘点 - 余生黄金回收
  • Windows一键处理Word文档:PDF转换+页码提取+目录生成(带源码和免安装exe)
  • 别再只看TDS值了!用Arduino做水质检测,这些滤波和温度补偿的坑你踩过吗?
  • 从零到一:手把手教你用ICC完成RISC芯片的物理实现全流程(含Milkway库创建与CTS实战)
  • 从Gaea到Houdini:程序化地形工作流打通实战(含Labs工具链配置)
  • 【计算机毕业设计案例】基于SpringBoot与微信小程序的健康管理系统基于springboot+小程序的个人健康管理系统小程序(程序+文档+讲解+定制)
  • 丽江哪里回收黄金靠谱 余生黄金回收30分钟上门 6家资质齐全门店实测 - 余生黄金回收
  • 西电RISC-V实验课必备:手把手教你用Jupiter搭建汇编开发环境(附环境变量配置避坑指南)
  • 黄山本地家电维修师傅电话推荐|本地维修家电|欧米到家统一报修 - 欧米到家
  • Self-RAG与Agentic RAG:解决RAG事实错误与路径不可复用的工程方案
  • Nucleus Co-Op:一站式革命性本地多人游戏解决方案
  • 2026哈尔滨黄金回收权威测评:K金铂金变现 - 奢侈品回收测评
  • 2026 邵东厨卫楼顶地下室漏水测评,吉修匠五星高分稳居榜首 - 吉修匠
  • 2026年AI消痕全网避坑指南:实测物理级降AIGC痕迹神器,降熵算法到底有多顶?
  • 新手别纠结!AD、PADS、Allegro三款PCB设计软件,到底该学哪个?(附学习路线建议)
  • MATLAB语音特征提取工具包:含分帧、梅尔滤波、对数压缩与DCT变换全流程实现
  • 2026 龙海厨卫楼顶地下室漏水测评,吉修匠五星高分稳居榜首 - 吉修匠
  • VLA已死,WAM是未来?大错特错,打通技术底座是实现架构互补的关键
  • VCS混合仿真避坑指南:手把手教你搞定VHDL和Verilog的Makefile配置
  • 2026报考必看:想报地理信息科学专业推荐这些学校 - 品牌2026
  • Spark 行动算子(Action)全面解析
  • PHP多维数组操作与聚合分析
  • 2026 西安价格实惠厕所天花板漏水处理公司 TOP4:厨卫漏水修缮甄选榜单 专业防水公司排名推荐(2026年5月防水补漏最新TOP权威排名) - 冠盾建筑修缮
  • 手把手教你用STM32CubeMX和HAL库驱动ILI9341屏幕(附Proteus仿真文件)
  • 南京如景装饰材料:高淳专业的玻璃隔断安装公司有哪些 - LYL仔仔
  • Chromatic:如何像外科手术一样精准修改Chromium/V8应用?
  • CSDN发布文章 markdown格式语法
  • 保姆级教程:在Windows 10/11上用JDK 8/11成功安装BurpSuite Community 2024(附浏览器代理配置避坑指南)
  • 保定 8 区县全套文案(全区统一固定标题:2026 上海防水补漏 + 瓷砖空鼓修复推荐,苏易修缮本土直营,老城老房漏水、瓷砖翘边拱起就近微创修) - 苏易修缮