当前位置：首页 > news >正文

利用高通跃龙QCS9100平台部署工业异常检测模型PaDiM(2): QNN转换与板端部署

news 2026/5/12 19:00:44

前言

上一篇我们把PaDiM模型的 backbone 导出成了 ONNX，统计参数也存好了。接下来就是把 ONNX 转成高通QCS9100平台上跑的格式，再在板子上把完整推理链路跑通。

说实话，QNN 这套工具链第一次用会觉得有点绕，但只要按步骤来，问题不大。这篇会尽量把命令和路径写清楚，你照着做能少踩点坑。

1. QNN SDK 安装与路径说明

1.1 下载 QNN SDK

去高通开发者官网下 QNN SDK，选和你 QCS9100 系统匹配的版本（比如 2.18、2.20 等）。解压后目录大概长这样：

qnn-v2.18.0/ ├── bin/ │ ├── x86_64-linux-clang/ # x86 Linux 工具 │ └── aarch64-android/ # Android 目标 ├── lib/ ├── include/ └── ...

我们主要用qnn-onnx-converter和qnn-model-lib-generator，这两个在 bin 下面。

1.2 设置环境变量

export QNN_SDK_ROOT=/path/to/qnn-v2.18.0 export PATH=$QNN_SDK_ROOT/bin/x86_64-linux-clang:$PATH export LD_LIBRARY_PATH=$QNN_SDK_ROOT/lib/x86_64-linux-clang:$LD_LIBRARY_PATH

建议写进~/.bashrc，每次开终端自动生效。

1.3 检查工具是否可用

qnn-onnx-converter --help qnn-model-lib-generator --help

能打出帮助信息说明环境 OK。

2. ONNX 转 QNN 模型

2.1 准备 ONNX 模型

上一篇导出的padim_resnet18_backbone.onnx直接拿来用。如果输入是动态 batch，建议先固定成 1，避免板端一些奇奇怪怪的问题：

# fix_onnx_batch.py import onnx from onnx import shape_inference model = onnx.load("padim_resnet18_backbone.onnx") # 固定 batch=1 for inp in model.graph.input: for d in inp.type.tensor_type.shape.dim: if d.dim_param == "batch": d.ClearField("dim_param") d.dim_value = 1 onnx.save(model, "padim_resnet18_backbone_fixed.onnx")

2.2 运行转换

qnn-onnx-converter \ --input_network padim_resnet18_backbone.onnx \ --output_path padim_qnn \ --input_list input_names.txt

input_names.txt内容（根据你 ONNX 的实际输入名调整）：

image 1 3 256 256

格式是：输入名 batch channel height width。

2.3 量化

QCS9100 的 NPU 跑 INT8 比 FP32 快很多，建议做量化。准备一些校准图片（正常样本裁成 256×256），列个清单：

# calibration_list.txt /path/to/img1.png /path/to/img2.png ...

然后：

qnn-onnx-converter \ --input_network padim_resnet18_backbone.onnx \ --output_path padim_qnn_quant \ --input_list input_names.txt \ --quantization_overrides quantization_overrides.json

quantization_overrides.json示例（按需调整）：

{ "ConvertFp16ToFp32": ["Conv", "Gemm"], "Quantization": { "image": { "quantization_scheme": "quantization_scheme_range_unsigned_symmetric", "bit_width": 8, "calibration_method": "calibration_method_per_channel" } } }

量化这块不同版本 QNN 参数可能不一样，以官方文档为准。转完之后会得到.bin和.cpp等文件，这些就是板端要用的。

3. 生成可执行库

qnn-model-lib-generator \ --model padim_qnn/padim_resnet18_backbone.cpp \ --model padim_qnn/padim_resnet18_backbone.bin \ --output_dir padim_lib

生成完会有一坨.so或静态库，这就是在 QCS9100 上要链接的推理库。

4. 板端部署思路

4.1 文件准备

把下面这些拷到板子：

padim_lib/下的库文件
padim_mean.npy、padim_cov_inv.npy
QNN 的 runtime 库（在 QNN SDK 的lib里，按目标架构选）

4.2 推理流程伪代码

初始化QNN context，加载 backbone 模型
加载padim_mean.npy、padim_cov_inv.npy
循环：
a. 从摄像头/文件读一帧图像
b. 预处理：resize 到 256×256，减均值除方差（和训练时一致）
c. 调用 QNN 执行 backbone 前向 → 得到 layer1/2/3 特征
d. 按 PaDiM 论文把多层特征拼接、reshape
e. 用马氏距离公式算异常分数
f. 大于阈值判异常，可选画热力图

4.3 Python 板端示例（有 QNN Python 绑定时）

# 伪代码，具体 API 以 QNN Python 包为准 from qnn import QNNRuntime import numpy as np rt = QNNRuntime(model_path="padim_backbone.qnn") mean = np.load("padim_mean.npy") cov_inv = np.load("padim_cov_inv.npy") def infer(image): # image: 256x256x3, 预处理后 feat = rt.execute(image) # 按 PaDiM 公式算马氏距离 score = mahalanobis(feat, mean, cov_inv) return score