当前位置: 首页 > news >正文

端到端课程自用 6 规划 端到端的模型训练范式 AI 笔记

概述

多任务

  • Traffic light head→ 红绿灯检测
  • OCR/ETC/...→ 指示牌分类/OCR、ETC口/抬杆检测
  • OCC head→ OCC感知(Occupancy感知)
  • OD Former (PETR)→ 动态障碍物检测 + 时序跟踪/预测
  • Map Former (MapTr)→ 静态车道线建图
  • Planner Former→ Planning规划 → 输出轨迹Trajectory
  • Transformer-based Head :
    在 OD Former 中:QKV 用于建模“物体-物体”、“物体-场景”之间的时空关系(如跟踪、预测)
    在 Map Former 中:QKV 用于建模“车道线-车道线”、“车道线-车辆”之间的关系(如建图一致性)
    在 Planner Former 中:QKV 用于建模“自车-障碍物-车道线”之间的交互,生成安全轨迹

训练的难点

多loss平衡
各种训练策略
多种数据标注

解决思路 多阶段训练

解决训练不稳定 复杂度爆炸
整体思路可以是训练感知和训练规划分开

感知阶段

预训练 image backbone 为主要训练对象 加上红绿灯检测 辅助任务 杆牌检测 多loss平衡
单帧训练 学习3D感知能力 backbone 学习率要小 多loss平衡 主要学习 bev backbone 解码器:od former PETR方法 map former Maptr方法 occ header
时序训练 学习率适当减小 backbone 可以freeze

规划阶段

先 freeze 其他模块
模仿人类驾驶轨迹
需要多种多样的数据 分布很重要 需要不同场景行为 左右转弯 掉头等

然后 感知与planning一起训练 把整体学习率变小
此时感知模块的loss weifht可以调小

planning强化学习 更小的学习率 仅训练planning

一段式端到端和两段式训练方法的对比和区别

两段式 的出现有历史背景 感知各种方法收敛之后 pnc数据驱动尚未成熟
把感知整合到一起 然后 规划成为一个独立模型
区别在于梯度在训练时候是否要反传

两段式训练阶段

仅训练planning
注意点同感知的训练
但是 可以把感知的数据推理结果作为输入

http://www.jsqmd.com/news/780814/

相关文章:

  • Infio-Copilot:让AI成为你的Obsidian知识管理副驾驶
  • Vue3项目实战:用vuedraggable-next搞定拖拽列表,附带动画过渡与常见报错解决
  • 强化学习结合连续思维链提升大模型推理能力
  • Unity性能优化实战:用Magica Cloth的Virtual Deformer把高模裙子顶点数砍掉80%
  • 基于Agentic Template的智能体应用开发脚手架:从架构设计到生产部署
  • 矩阵乘法加速:协同设计突破带宽墙
  • 基于Obsidian CLI与OpenClaw实现每日笔记自动化归档与链接维护
  • ARM SME指令集:LD1W与LDNT1B深度解析与优化实践
  • 开源大模型部署利器Bedrock:统一API编排与生产级实践指南
  • 别再死记公式了!用Python+LTspice仿真,5分钟搞懂采样保持电路的KT/C噪声到底怎么算
  • 开源技能库OpenClaw:结构化管理与复用开发技巧的工程实践
  • 基于多智能体架构的AI模拟法庭系统:律师案件预演的革命性工具
  • SafeLink:基于智能合约与ERC-8004的AI Agent去信任协作协议
  • 保姆级教程:用R语言从FinnGen数据库下载并整理GWAS数据(附完整代码)
  • Canvas动画光标库ani-cursor.js:原理、实现与性能优化
  • Python后端Flask如何实现短信验证码发送_调用云厂商API实现功能
  • XAP SDK:构建AI智能体间可信经济协作的结算协议与Python实践
  • 从微波炉到飞机:聊聊那些“说明书”里没写的安全边界,以适航管理为例
  • 本地部署大语言模型聊天应用:从原理到实战的完整指南
  • LLM维基百科插件:实时知识检索增强大语言模型应用
  • 智能体协作框架SkillOrchestra:动态技能转移与高效路由分配
  • 为Gemini CLI开发扩展:从插件机制到实战应用
  • LVGL界面布局避坑指南:为什么你的lv_obj_align_to总对不齐?
  • 基于AWS无服务器架构构建OpenAI API代理网关:全栈开发者的AI集成实践
  • GaN-on-Si射频技术:成本优势与5G应用前景解析
  • SwiftUI集成Claude与DALL·E:构建iOS原生AI应用实战
  • 保姆级教程:用DF2K和OST数据集复现Real-ESRGAN训练全流程(附超参数避坑点)
  • Arm Neoverse V3AE核心架构与电源管理技术解析
  • Claude智能体任务协调工具:Windows桌面自动化工作流实践指南
  • 数学解题与代码生成:分层提示模板设计实践