当前位置: 首页 > news >正文

0222cursor日志

进展其实很大,0211 这轮日志已经说明主链路基本打通,剩下的是“个别图片模型本身没检出”问题,不是可视化脚本错。

本轮关键结论

1) 可视化链路已一致

下位机输出结果0211.txt 的“检测到N车位”和 draw_tensor2psd_result0211.txt 的 len(infer_data)严格对应(len = N * 20):

  • 1.bmp: 检测到0 → len=0
  • 2.bmp: 检测到1 → len=20
  • 3.bmp: 检测到5 → len=100
  • 4.bmp: 检测到3 → len=60
  • 5.bmp: 检测到1 → len=20
  • 6.bmp: 检测到2 → len=40
  • 7.bmp: 检测到8 → len=160
  • 8.bmp: 检测到3 → len=60
  • 9.bmp: 检测到2 → len=40
  • 10.bmp: 检测到6 → len=120
  • 11.bmp: 检测到0 → len=0
  • 12.bmp: 检测到2 → len=40

这说明:“有些图什么都没有”是因为下位机本来就输出0个车位,不是 draw 脚本丢了框。


2) inf/scale=0问题已基本消失

你这轮日志里没有再看到:

  • save to conf = inf
  • WARN: scale=0

说明我们加的 scale 保护和索引/stride修复是有效的。


3) 剩余问题是“模型在个别图上置信度接近0”

例如 1.bmp、11.bmp:

  • det_all stats: max_conf=0.0000, conf_pass=0, final=0

这类图即使再降阈值也救不回来(max_conf本身就是0)。


4) 仍有一个风险:候选过多触发 overflow

例如 7.bmp、10.bmp 出现了:

  • overflow > 0
  • det_all final=100(达到上限)

这会截断候选,可能影响最终质量,但不导致“空图”。


你现在最该做的两步(最快)

1) 只针对空图(1.bmp、11.bmp)做输入一致性比对

  • 同一张图在上位机/PC 后处理输出 max_conf 对比下位机
  • 如果 PC 有、下位机没有:继续查下位机前处理/量化尺度
  • 如果 PC 也没有:是模型本身漏检(非代码问题)

2) 导出并检查下位机预处理后的输入图

  • 确认 1.bmp/11.bmp 送入网络的图像是否正常(亮度、顺序、是否读错图)

如果你愿意,我下一步可以直接给你加一个“每张图保存预处理后输入BMP + 打印每个head top-k conf”的小补丁,这样一次跑完就能把“代码问题 vs 模型问题”彻底分开。

请帮我加上加一个“每张图保存预处理后输入BMP + 打印每个head top-k conf”的小补丁,记得留下开关,方便我关必预处理后的图片保存

我会在 main.c 和 mult_yolov5_post_copy.c 加两个可控开关:

1) 是否保存“预处理后输入BMP”

2) 是否打印每个 head 的 top-k conf。

先快速读一下现有预处理与日志代码的位置,然后直接打补丁。

已加好你要的“小补丁”,并且都带了开关,明天可直接用。

1) 保存预处理后输入 BMP(带开关)

在 main.c 新增:

  • 开关:

    #define DEBUG_SAVE_PREPROC_BMP (0)

  • 功能:把送入网络前的 resize 后图(pOutPlanes)保存为 BMP
  • 输出路径:

<output_file_path>/img/preproc_<原图文件名>.bmp

> 要开启时把 0 改成 1 即可;关掉就不保存。


2) 打印每个 head 的 top-k conf(带开关)

在 mult_yolov5_post_copy.c 新增:

  • 开关:

    #define DEBUG_PRINT_TOPK_CONF (1)

    #define TOPK_CONF_NUM (5)

  • 每个 head 输出:

    det_head[x] topk_conf: c1 c2 c3 c4 c5

这能让你快速判断“该图到底有没有高置信度候选”,避免只看最终 检测到N车位。


3) 你明天的最短验证步骤

  1. 先保持 DEBUG_PRINT_TOPK_CONF=1
  1. 先把 DEBUG_SAVE_PREPROC_BMP=0(避免占空间)
  1. 若某图仍异常,再把 DEBUG_SAVE_PREPROC_BMP=1,只跑那几张重点图对比输入是否异常。

如果你明天把新日志贴我(尤其是 topk_conf),我可以很快帮你判断是阈值问题还是模型输出本身问题。

http://www.jsqmd.com/news/403287/

相关文章:

  • 大数据领域分布式存储的扩展性设计思路
  • Python json write serialized content to json file
  • 【脑洞编程】从“治国理政”看懂C++广播机制:全局变量的“中央集权”与“局部自治”
  • 设计一个电商平台的购物车系统。
  • C++ 多线程与并发系统取向(二)—— 资源保护:std::mutex 与 RAII(类比 Java synchronized)
  • 深入理解 Java join:它到底做了什么?和协程挂起有什么区别?
  • Java 版 Claude Code CLI 来了!(国产开源)Solon Code CLI 发布
  • [AI提效-15]-豆包多对话功能详解:打破传统AI工具“单对话单一主题、新对话从零起步”的局限,高效衔接创作,告别反复沟通成本。
  • SpringBoot整合ES8向量检索:构建高精度智能客服系统的工程实践
  • 幽灵客户端
  • 电商智能客服Agent工作流架构优化实战:从高延迟到毫秒级响应
  • 视频孪生平台之上:镜像视界三维实时解算体系在港口与机场复杂场景协同治理中的全球领先性研究
  • 视频孪生平台之上:镜像视界三维实时解算体系在公安空间治安操作系统中的全球领先性研究
  • 大规模语言模型的反事实推理在战略规划中的多维度应用
  • 解读AI原生应用领域差分隐私的重要性
  • C++罗马曲面3D旋转程序代码解说_C++精灵库应用案例
  • 【开题答辩全过程】以 高校实验室管理系统为例,包含答辩的问题和答案
  • AI应用架构师困惑:AI驱动芯片设计,数据不够怎么办?
  • [use agent-browser not playwright directly]
  • AI-RAN Sionna开发者套件全解析:从入门到集群,开启无线通信与AI融合开发新纪元
  • AI原生应用领域自主代理的故障诊断与修复
  • Vue实现智能客服对话框与推荐问题展示:从架构设计到AI集成实战
  • 如何在WSL中设置AMD AI MAX 395的Rocm微调环境
  • Flink实时计算心智模型——流、窗口、水位线、状态与Checkpoint的协作
  • 百度AI智能客服Prompt设置实战:从零搭建高效对话系统的避坑指南
  • 2024提示工程安全趋势:加密传输机制的3个创新方向
  • 【GitHub项目推荐--Heretic:全自动语言模型去审查工具】⭐⭐⭐
  • 【GitHub项目推荐--Flet:Python全栈开发者的跨平台应用框架】⭐
  • 智能客服转人工:从架构设计到实战避坑指南
  • Node.js运维部署实战:从0到1开始搭建Node.js运行环境