当前位置: 首页 > news >正文

PSD 车位可视化异常总结

下面是截至目前为止的完整排查进度总结,并对“下位机 PSD 车位可视化异常”的根因作出阶段性分析,便于对外汇报与后续推进。


一、问题现象

  • PSD 车位可视化结果异常(部分图片无车位、部分位置异常)
  • RM/FSD 正常
  • 上位机推理正常
  • 模型输入尺寸从 544×480 切换到 608×736 后异常变明显

二、已完成的排查路径与结论(含证据)

1) 确认输入/原图尺寸正确

证据:下位机日志

input_sizes[0]=608, input_sizes[1]=736

Image Pre processing for image of size 480 x 544

结论:输入和原图尺寸无误,非尺寸配置问题。


2) 排除“可视化坐标映射错误”

方法:输出 _model.bmp / _model_swap.bmp 并加入 raw 坐标自适应缩放

证据:draw_tensor2psd_result 多次出现

raw_max 在部分图超原图范围 / 有时在原图内

结论:raw 坐标本身不稳定,不是单纯画图映射问题。


3) 修复输出 tensor 指针生命周期

问题:map 后立即 unmap,再解码

结论:存在悬空指针风险

措施:map → decode → unmap

结果:消除未定义行为,但异常仍存在


4) 输出 tensor 数据类型确认

证据:下位机日志

outElementType(TIDL)=2 vxType=VX_TYPE_UINT16

结论:输出为 uint16,解码端 unsigned short* 匹配 ✅


5) 修复输出 tensor stride(关键)

问题:map 时 stride[0]=1 只适用于 uint8

结论:uint16 必须 stride=2,否则数据错位

措施:按输出类型计算 stride

结果:raw 坐标变合理,部分图可视化变正常


6) 修复检测头索引错位(关键)

问题:模型检测头输出在 output[1..3],解码固定用 0..2

结论:参数与数据错位

措施:1→0, 2→1, 3→2 重新映射

结果:可视化明显改善,但仍有“部分图片无车位”


7) 阈值导致“无车位输出”

证据(0206 日志)

  • 错图对应 max_conf < conf_thresh
  • 检测结果 0 → bin 空 → 可视化无车位

结论:并不是画错,而是被阈值过滤

措施:降低 conf_thresh 到 0.10

结果:部分“原本无车位”的图开始有输出,但带来另一个问题


8) 越界写导致 inf(新问题)

证据(0210 日志)

max_conf=inf max_cls=inf max_score=inf

conf_pass 很大

结论:bbox 数量超过上限 100,数组越界 → 覆盖统计变量

措施:加入越界保护 + overflow 统计

结果:预计 inf 消失,可继续验证


三、阶段性根因分析(当前结论)

✅ 已确认的根因(已修复)

  1. 输出 tensor 映射 stride 错误 → 导致 raw_data 读取错位
  1. 检测头索引错位 → 导致解码使用错头参数
  1. 输出 tensor 提前 unmap → 存在悬空指针风险

这些修复后,部分图片已能正确输出,说明核心解码链路趋于正常。


⚠ 当前仍在影响的原因

  1. 低置信度导致“无车位输出”
  • max_conf 低于阈值 → bin 为空
  • 可视化“空图”是因为没有输出
  1. 阈值降低引发的越界写
  • 过多候选 → bbox_num 超上限
  • 已加 overflow 防护,待验证

四、现阶段结论

“部分图正常、部分图没有车位”的现象已经不是解码错位,而是阈值与候选数量共同作用的结果。

  • 置信度低 → 被过滤 → 无车位输出
  • 降阈值 → 候选多 → 越界 → 统计异常

五、当前进度状态

  • 解码链路已基本修正(stride + head 映射 + map/unmap)
  • 可视化逻辑已稳定
  • 剩余问题集中在 阈值策略与候选数量控制

如果你需要,我可以再提供一版“后续计划 + 风险评估”的汇报页。

http://www.jsqmd.com/news/367051/

相关文章:

  • 零基础入门灵感画廊:从梦境描述到惊艳画作的全流程指南
  • 告别云端依赖:DeepSeek-R1本地对话系统部署详解
  • 2026年评价高的中心供氧汇流排/集中中心供氧可靠供应商参考哪家靠谱(可靠) - 行业平台推荐
  • cv_unet_image-colorization镜像免配置:Streamlit一键启动开箱即用
  • Qwen2.5-VL视觉定位模型开箱体验:输入文字就能找到图片目标
  • 2026年热门的学生餐团餐配送/会议餐团餐配送最新推荐及选购参考公司 - 行业平台推荐
  • 自动驾驶分级(SAE L0-L5)演进史:从辅助驾驶到完全无人化的技术鸿沟与实现路径
  • Janus-Pro-7B在内容创作中的5个实用场景
  • 2026年知名的液压三段力缓冲铰链/静音三段力缓冲铰链直销厂家采购指南如何选 - 行业平台推荐
  • Z-Image-Turbo创意玩法:打造专属孙珍妮AI艺术照
  • 万象熔炉Anything XL开箱测评:这些二次元效果太惊艳了!
  • 医疗AI神器MedGemma-X:快速生成结构化诊断报告
  • 2026年口碑好的弥散供氧/弥散供氧分子筛制氧机高评价直销厂家采购指南推荐(高评价) - 行业平台推荐
  • 深求·墨鉴OCR工具5分钟上手:古籍数字化一键搞定
  • 零基础玩转EasyAnimateV5:7B参数图生视频模型保姆级部署指南
  • 2026年热门的人脸识别智能门锁/房门智能门锁厂家选择指南怎么选(真实参考) - 行业平台推荐
  • 赛博风AI神器OFA-VE:一键部署视觉推理系统教程
  • 详细介绍:电商零售ELK应用:五大核心场景解析
  • Ollama+granite-4.0-h-350m企业应用:中小企业低成本AI助手搭建方案
  • 立知多模态模型实战:解决‘找得到但排不准‘难题
  • PIPIOJ 1244: PIPI的函数
  • TinyNAS搜索空间可视化:DAMO-YOLO子网络结构拓扑图生成教程
  • 语音克隆新体验:Qwen3-TTS流式生成教程
  • GME-Qwen2-VL-2B-Instruct入门指南:视觉文本对齐任务中Query/Key向量构造规范
  • 浦语灵笔2.5-7B视觉问答模型:从部署到实战案例分享
  • DAMO-YOLO TinyNAS 应用指南:智能图像处理全解析
  • 小白必看!EasyAnimateV5图生视频功能实测与效果展示
  • 2026年热门的幼儿园特教设备/特教设备资源教室销售厂家推荐哪家好(真实参考) - 行业平台推荐
  • RetinaFace+CurricularFace镜像:人脸识别的极简解决方案
  • GLM-4.7-Flash快速上手:ollama一键部署实战指南