当前位置：首页 > news >正文

PSD 车位可视化异常总结

news 2026/3/30 15:11:30

下面是截至目前为止的完整排查进度总结，并对“下位机 PSD 车位可视化异常”的根因作出阶段性分析，便于对外汇报与后续推进。

一、问题现象

PSD 车位可视化结果异常（部分图片无车位、部分位置异常）

RM/FSD 正常

上位机推理正常

模型输入尺寸从 544×480 切换到 608×736 后异常变明显

二、已完成的排查路径与结论（含证据）

1) 确认输入/原图尺寸正确

证据：下位机日志

input_sizes[0]=608, input_sizes[1]=736

Image Pre processing for image of size 480 x 544

结论：输入和原图尺寸无误，非尺寸配置问题。

2) 排除“可视化坐标映射错误”

方法：输出 _model.bmp / _model_swap.bmp 并加入 raw 坐标自适应缩放

证据：draw_tensor2psd_result 多次出现

raw_max 在部分图超原图范围 / 有时在原图内

结论：raw 坐标本身不稳定，不是单纯画图映射问题。

3) 修复输出 tensor 指针生命周期

问题：map 后立即 unmap，再解码

结论：存在悬空指针风险

措施：map → decode → unmap

结果：消除未定义行为，但异常仍存在

4) 输出 tensor 数据类型确认

证据：下位机日志

outElementType(TIDL)=2 vxType=VX_TYPE_UINT16

结论：输出为 uint16，解码端 unsigned short* 匹配 ✅

5) 修复输出 tensor stride（关键）

问题：map 时 stride[0]=1 只适用于 uint8

结论：uint16 必须 stride=2，否则数据错位

措施：按输出类型计算 stride

结果：raw 坐标变合理，部分图可视化变正常

6) 修复检测头索引错位（关键）

问题：模型检测头输出在 output[1..3]，解码固定用 0..2

结论：参数与数据错位

措施：1→0, 2→1, 3→2 重新映射

结果：可视化明显改善，但仍有“部分图片无车位”

7) 阈值导致“无车位输出”

证据（0206 日志）

错图对应 max_conf < conf_thresh

检测结果 0 → bin 空 → 可视化无车位

结论：并不是画错，而是被阈值过滤

措施：降低 conf_thresh 到 0.10

结果：部分“原本无车位”的图开始有输出，但带来另一个问题

8) 越界写导致 inf（新问题）

证据（0210 日志）

max_conf=inf max_cls=inf max_score=inf

conf_pass 很大

结论：bbox 数量超过上限 100，数组越界 → 覆盖统计变量

措施：加入越界保护 + overflow 统计

结果：预计 inf 消失，可继续验证

三、阶段性根因分析（当前结论）

✅ 已确认的根因（已修复）

输出 tensor 映射 stride 错误 → 导致 raw_data 读取错位

检测头索引错位 → 导致解码使用错头参数

输出 tensor 提前 unmap → 存在悬空指针风险

这些修复后，部分图片已能正确输出，说明核心解码链路趋于正常。

⚠ 当前仍在影响的原因

低置信度导致“无车位输出”

max_conf 低于阈值 → bin 为空

可视化“空图”是因为没有输出

阈值降低引发的越界写

过多候选 → bbox_num 超上限

已加 overflow 防护，待验证

四、现阶段结论

“部分图正常、部分图没有车位”的现象已经不是解码错位，而是阈值与候选数量共同作用的结果。

置信度低 → 被过滤 → 无车位输出

降阈值 → 候选多 → 越界 → 统计异常

五、当前进度状态

解码链路已基本修正（stride + head 映射 + map/unmap）

可视化逻辑已稳定

剩余问题集中在阈值策略与候选数量控制

如果你需要，我可以再提供一版“后续计划 + 风险评估”的汇报页。

查看全文

http://www.jsqmd.com/news/367051/

零基础入门灵感画廊：从梦境描述到惊艳画作的全流程指南

告别云端依赖：DeepSeek-R1本地对话系统部署详解

2026年评价高的中心供氧汇流排/集中中心供氧可靠供应商参考哪家靠谱（可靠） - 行业平台推荐

cv_unet_image-colorization镜像免配置：Streamlit一键启动开箱即用

Qwen2.5-VL视觉定位模型开箱体验：输入文字就能找到图片目标

自动驾驶分级（SAE L0-L5）演进史：从辅助驾驶到完全无人化的技术鸿沟与实现路径

Janus-Pro-7B在内容创作中的5个实用场景

2026年知名的液压三段力缓冲铰链/静音三段力缓冲铰链直销厂家采购指南如何选 - 行业平台推荐

Z-Image-Turbo创意玩法：打造专属孙珍妮AI艺术照

万象熔炉Anything XL开箱测评：这些二次元效果太惊艳了！

医疗AI神器MedGemma-X：快速生成结构化诊断报告

2026年口碑好的弥散供氧/弥散供氧分子筛制氧机高评价直销厂家采购指南推荐（高评价） - 行业平台推荐

深求·墨鉴OCR工具5分钟上手：古籍数字化一键搞定

零基础玩转EasyAnimateV5：7B参数图生视频模型保姆级部署指南

赛博风AI神器OFA-VE：一键部署视觉推理系统教程

详细介绍：电商零售ELK应用：五大核心场景解析

Ollama+granite-4.0-h-350m企业应用：中小企业低成本AI助手搭建方案

立知多模态模型实战：解决‘找得到但排不准‘难题

PIPIOJ 1244: PIPI的函数

TinyNAS搜索空间可视化：DAMO-YOLO子网络结构拓扑图生成教程

语音克隆新体验：Qwen3-TTS流式生成教程

GME-Qwen2-VL-2B-Instruct入门指南：视觉文本对齐任务中Query/Key向量构造规范

浦语灵笔2.5-7B视觉问答模型：从部署到实战案例分享

DAMO-YOLO TinyNAS 应用指南：智能图像处理全解析

小白必看！EasyAnimateV5图生视频功能实测与效果展示

RetinaFace+CurricularFace镜像：人脸识别的极简解决方案

GLM-4.7-Flash快速上手：ollama一键部署实战指南