当前位置: 首页 > news >正文

SAGE-Net:融合语义信息的自动驾驶注意力预测框架

摘要

在自动驾驶领域,准确预测驾驶员的注意力焦点对于实现安全高效的驾驶决策至关重要。传统方法主要依赖人类眼动数据来构建显著性图,但这种方式存在明显局限性。本文介绍一种创新的语义增强注视检测方法(SAGE, Semantics Augmented GazE),通过将场景语义信息与原始眼动数据相结合,构建更加全面的注意力预测框架SAGE-Net。


1. 研究背景与动机

1.1 为什么仅依赖眼动数据不够?

现有的驾驶场景显著性预测算法主要通过两种方式获取眼动数据:车载眼动仪采集或实验室环境模拟标注。然而,单纯的眼动信息存在以下四个核心问题:

(1)周边视觉的遗漏

人类驾驶时会利用周边视觉感知环境,即眼睛注视一个物体的同时能够关注到其他区域。眼动仪只能捕捉注视点,无法记录周边视觉获取的信息。

(2)单一焦点的限制

当驾驶员判断来车或行人不会与自车发生碰撞时,往往会将视线移开。这种行为模式是导致交通事故的重要原因之一,而基于眼动的模型会学习到这种不安全的注意力分配模式。

(3)注意力分散的干扰

驾驶过程中,驾驶员可能被路边的建筑物、广告牌等与驾驶无关的物体吸引。这些分散注意力的行为会被记录到眼动数据中,影响模型学习。

(4)中心偏置问题

大部分驾驶时间内,驾驶员的视线集中在道路前方中央区域。深度学习

http://www.jsqmd.com/news/299518/

相关文章:

  • Flutter for OpenHarmony:用 StatefulWidget 实现基础用户交互
  • 【读论文】EQ情感智能benchmark:EmoBench
  • YOLO26改进 - 采样 | 小目标分割救星:HWD 降采样少丢细节提精度
  • 【统一功能处理】从入门到源码:拦截器学习指南(含适配器模式深度解读) - 教程
  • 洛谷 P1918:保龄球 ← STL map
  • 详细介绍:C++蓝桥杯之结构体10.15
  • 抖店商品图如何保存到手机上的方法
  • 云端推理中的模型量化技术:减小体积提升速度
  • C++实现ATM状态机
  • 导师严选2026 AI论文工具TOP10:自考论文写作全攻略
  • Java毕设项目推荐-基于SpringBoot的社区公益服务管理平台 基于springboot的社区志愿者服务系统【附源码+文档,调试定制服务】
  • 【计算机毕业设计案例】基于springboot的居民志愿服务智慧系统社区志愿者服务系统(程序+文档+讲解+定制)
  • 学长亲荐8个AI论文平台,助你搞定本科毕业论文!
  • 论文《关于预防人工智能反叛的初步探讨》修订版
  • SMU 2026 ptlks的周报Week 1
  • 2025年少儿编程推荐:五家优选品牌深度全面对比解析
  • 用 CrossOver 体验“魔法世界”:在 Mac 电脑畅玩《霍格沃茨之遗》保姆级教程
  • 2025年少儿编程哪家靠谱?主流上榜五家品牌全面深度解析
  • GLM-ASR-Nano-2512:中文方言识别与低音量语音处理的最佳开源方案
  • 2026年AI智能体替代员工:从理论到实践,小白也能上手的数字员工教程
  • 从入门到精通:RAG系统中检索与生成之间的增强层,收藏级技术指南
  • 【超详细】大模型学习路线图,从入门到应用(建议收藏)
  • 如何系统化的学习金融,投资,理财?
  • 字符串相关
  • 兰亭妙微:以交互与网站设计之力,重塑行业门户新标杆
  • 兰亭妙微:以HTML前端、UI/交互/图标设计赋能数字孪生与大屏设计新标杆
  • 【第三十二周】RAG学习02
  • Lab2-system calls MIT6.1810操作系统工程【持续更新】
  • 学霸同款2026 AI论文写作软件TOP9:研究生开题报告必备测评
  • 面向 OpenHarmony 的 Flutter 应用实战:TodoList 多条件过滤系统的状态管理与性能优化