【RT-DETR实战】122、算能(Sophgo)TPU平台部署探索:从模型转换到性能调优的血泪史
今天在实验室调试RT-DETR的TPU部署,模型转换倒是顺利通过了,一上板子推理直接卡死。
抓了半小时日志才发现,原来某个卷积层的padding参数TPU编译器不支持自动转换。这种平台差异的坑,不实际跑一遍根本想不到。
模型转换的暗礁
算能的TPU平台使用自家开发的BMNETC编译器链,官方文档看着清晰,实际用起来处处是细节。RT-DETR的PyTorch模型转ONNX还算常规操作,但ONNX到BModel的过程就考验耐心了。
# 转换命令示例 - 这里踩过坑# 别直接使用默认参数,特别是输入shape的设定bmnetc--model=rtdetr.onnx \--target=BM1684X \# 芯片型号必须明确指定