当前位置：首页 > news >正文

手把手教你用QNN SDK的C++示例程序跑通第一个AI模型（Linux/Android环境）

news 2026/7/15 21:02:23

从零跑通QNN SDK示例：Linux/Android环境下的AI模型实战指南

1. 环境准备与SDK部署

在开始之前，我们需要确保开发环境满足基本要求。对于Linux系统，推荐使用Ubuntu 20.04 LTS或更高版本；Android开发则需要预先配置好ADB调试环境。硬件方面，建议至少16GB内存和50GB可用存储空间，因为AI模型处理通常需要较大内存和存储资源。

关键依赖安装：

# 安装基础编译工具链 sudo apt update && sudo apt install -y build-essential cmake clang # 安装Android NDK (推荐r25c版本) wget https://dl.google.com/android/repository/android-ndk-r25c-linux.zip unzip android-ndk-r25c-linux.zip -d ~/

QNN SDK的目录结构需要特别关注：

QNN_SDK_ROOT/ ├── bin/ # 工具链和实用脚本 ├── examples/ # 示例代码 ├── include/ # 头文件 ├── lib/ # 预编译库文件 └── target/ # 平台特定资源

环境变量配置建议添加到~/.bashrc：

export QNN_SDK_ROOT=/path/to/qnn-sdk export ANDROID_NDK_ROOT=~/android-ndk-r25c export PATH=$PATH:$QNN_SDK_ROOT/bin

提示：使用envcheck脚本验证环境配置是否正确：
$QNN_SDK_ROOT/bin/envcheck -n

2. 示例项目结构解析

qnn-sample-app是QNN SDK中最核心的示例程序，位于$QNN_SDK_ROOT/examples/QNN/SampleApp目录。其代码结构体现了典型的AI推理应用架构：

SampleApp/ ├── CMakeLists.txt # 跨平台构建配置 ├── include/ # 公共头文件 │ └── SampleApp.hpp # 核心数据结构定义 ├── src/ │ ├── Main.cpp # 程序入口点 │ ├── SampleApp.cpp # 主要业务逻辑 │ └── Utils/ # 辅助工具类 │ ├── IOTensor.cpp # 张量处理 │ └── Logger.cpp # 日志系统 └── test/ # 测试用例

关键组件交互流程：

模型加载器：负责动态加载.so模型文件
后端管理器：处理不同计算后端(CPU/GPU/DSP)的初始化
执行引擎：协调图构建、优化和推理过程
IO处理器：处理输入数据准备和输出结果解析

3. Linux环境编译与运行

3.1 本地x86编译

使用Makefile构建本地可执行文件：

cd $QNN_SDK_ROOT/examples/QNN/SampleApp make all_x86

成功编译后，生成的二进制位于bin/x86_64-linux-clang/qnn-sample-app。典型的运行命令示例：

./bin/x86_64-linux-clang/qnn-sample-app \ --backend $QNN_SDK_ROOT/lib/x86_64-linux-clang/libQnnCpu.so \ --model $QNN_SDK_ROOT/examples/QNN/example_libs/x86_64-linux-clang/libqnn_model_float.so \ --input_list input_list.txt

3.2 交叉编译Android版本

构建ARM64 Android可执行文件：

make all_android

生成的二进制位于bin/aarch64-android/qnn-sample-app。部署到设备的典型流程：

adb push bin/aarch64-android/qnn-sample-app /data/local/tmp adb push $QNN_SDK_ROOT/lib/aarch64-android/libQnnCpu.so /data/local/tmp adb shell "cd /data/local/tmp && chmod +x qnn-sample-app && ./qnn-sample-app --backend libQnnCpu.so --model ..."

4. 核心代码逻辑剖析

4.1 模型加载机制

示例程序使用动态加载方式处理模型和后端：

// 加载后端库示例 void* backendHandle = dlopen("libQnnCpu.so", RTLD_NOW | RTLD_LOCAL); if (!backendHandle) { std::cerr << "加载后端失败: " << dlerror() << std::endl; return -1; } // 解析符号 auto createFn = (QnnBackend_CreateFn_t)dlsym(backendHandle, "QnnBackend_create"); if (!createFn) { std::cerr << "解析符号失败: " << dlerror() << std::endl; return -1; }

4.2 推理执行流程

完整的推理管线包括以下步骤：

上下文创建：建立执行环境
图构建：加载并优化模型
张量准备：配置输入输出缓冲区
执行触发：运行推理计算
结果收集：获取并处理输出

典型执行代码片段：

Qnn_ErrorHandle_t ret = QNN_SUCCESS; Qnn_GraphHandle_t graphHandle; // 创建图 ret = qnnInterface.graphCreate(context, &graphConfig, &graphHandle); if (ret != QNN_SUCCESS) { /* 错误处理 */ } // 设置输入输出 Qnn_Tensor_t* inputs = prepareInputTensors(); Qnn_Tensor_t* outputs = prepareOutputTensors(); // 执行推理 ret = qnnInterface.graphExecute(graphHandle, inputs, inputCount, outputs, outputCount, nullptr, nullptr); if (ret != QNN_SUCCESS) { /* 错误处理 */ } // 处理输出 processResults(outputs, outputCount);

5. 常见问题排查指南

5.1 编译阶段问题

问题1：缺少clang编译器

解决方案：安装LLVM工具链 sudo apt install clang-12 lldb-12 lld-12

问题2：Android NDK不兼容

现象：构建时出现ABI不匹配错误 解决方案：确保使用NDK r25c版本，并检查环境变量设置

5.2 运行时问题

问题3：库加载失败

错误信息：dlopen failed: library "libQnnCpu.so" not found 解决方案： 1. 确保库路径正确 2. 设置LD_LIBRARY_PATH环境变量 3. 检查库的架构是否匹配目标平台

问题4：模型输入不匹配

错误信息：Input tensor shape mismatch 解决方案： 1. 使用模型分析工具检查期望的输入维度 2. 预处理输入数据确保格式正确 3. 验证模型是否完整无损

6. 性能优化技巧

后端选择策略：
- CPU后端：通用性强但性能一般
- GPU后端：适合并行计算密集型任务
- DSP/HTP：能效比最优的移动端方案
缓存利用：

// 保存上下文到二进制文件 qnnInterface.contextGetBinary(context, buffer, size, &writtenSize); // 从缓存加载 qnnInterface.contextCreateFromBinary(backend, device, config, cachedData, dataSize, &context);

异步执行模式：

Qnn_ProfileHandle_t profileHandle; qnnInterface.profileCreate(backend, QNN_PROFILE_LEVEL_DETAILED, &profileHandle); // 异步执行 qnnInterface.graphExecuteAsync(graph, inputs, inputCount, outputs, outputCount, callback, userData);

7. 进阶开发方向

自定义算子集成：

实现QnnOpPackage接口
注册自定义算子包

qnnInterface.backendRegisterOpPackage(backend, "libCustomOps.so", "CustomOpPackage_interfaceProvider");

多模型流水线：
- 创建多个上下文实例
- 设计模型间数据传递机制
- 实现并行执行调度

动态形状支持：

Qnn_Tensor_t dynamicTensor; dynamicTensor.v1.dimensions = nullptr; // 表示动态维度 dynamicTensor.v1.numDimensions = 0; // 运行时确定

在实际项目中，我发现最耗时的部分往往是数据预处理和后处理，而非模型推理本身。通过将IO操作与计算重叠，并使用内存池技术，通常可以获得显著的性能提升。

查看全文

http://www.jsqmd.com/news/574459/

douyin-downloader：重新定义抖音音频提取效率，从3小时到10分钟的蜕变

Halcon图像处理实战：定义域操作、精准裁剪与高级变形技巧

基于Docker与n8n的AI日程助手：从零搭建飞书智能提醒系统

Pixel Epic · Wisdom Terminal 处理403 Forbidden等HTTP错误：智能诊断与修复建议

Kandinsky-5.0-I2V-Lite-5s赋能教育：将静态知识图谱转化为动态讲解视频

避坑指南：用MATLAB SD Toolbox设计降采样滤波器时常见的5个配置错误

Spring Framework 5.3.x DoS漏洞解析与升级指南

GME-Qwen2-VL-2B-Instruct解决403 Forbidden：模型API访问权限与安全配置指南

别再只用Vditor的默认配置了！Vue3项目里这几个高级玩法让你的Markdown编辑器更顺手

NaViL-9B效果对比：与Qwen-VL、LLaVA在中文图文任务表现

30分钟搞定OpenClaw：Qwen3-4B镜像云端体验与技能测试

Ubuntu22.04安装MATLAB R2024a避坑指南：从镜像挂载到字体缩放全流程

黑苹果Mojave下AR9285+AR3011双驱动实战：从拆机到完美使用蓝牙耳机

Java向量API从零到上线：手把手带你重构图像处理模块，CPU利用率直降62%

开关电源环路解析：Boost变换器传递函数Gvd(s)的建模与验证

OpenClaw自动化流水线：Phi-3-vision处理图片转Excel报表

免费域名服务的SEO优化效果如何

Webgoat靶场XSS通关避坑指南：手把手教你绕过过滤、盗取Cookie与实战防御（含OWASP Encoder配置）

告别官方限制！用Docker Compose部署n8n 2.0，解锁Execute Command和文件监控的完整教程

Excel必备工具箱

3个极简功能让时间管理者实现高效时间规划：Catime计时器全场景应用指南

计算机底层数据表示漫谈：为什么你的照片、音乐在电脑里都是0和1？

国密SM2实战：从密钥生成到安全通信的全流程解析

Phi-4-mini-reasoning惊艳效果：对‘一句话总结核心意思’类文本推理任务精准凝练

lingbot-depth-pretrain-vitl-14效果对比展示：单目估计 vs 深度补全边缘锐度与平滑性

GLM-4-9B-Chat-1M安全部署：企业级隐私保护方案

快速验证模型服务：AutoGen Studio中连接vLLM部署的Qwen3-4B

Linux无头服务器上解决GSettings报错：手把手教你设置DBUS_SESSION_BUS_ADDRESS

别再死记硬背了！用C++手把手带你图解哈夫曼树构建全过程（附完整可运行代码）

2026年Python部署范式剧变：PEP 719正式通过后，所有.py文件将默认生成.aot.so——你的CI/CD流水线还支持.py吗？