当前位置：首页 > news >正文

1.2.1 AI-＞ONNX模型格式标准（ONNX Alliance）：ONNX（Open Neural Network Exchange）

news 2026/3/27 4:13:31

ONNX（Open Neural Network Exchange，开放神经网络交换）是一套用于表示机器学习模型的开放标准格式，由 Linux 基金会 AI & Data 旗下的 ONNX 联盟（ONNX Alliance）维护，其核心目标是消除深度学习框架壁垒，实现模型在不同框架、工具、硬件间的自由迁移与部署

ONNX 联盟（ONNX Alliance）

ONNX 最初由 Facebook（Meta）与微软于 2017 年联合发起，后纳入Linux 基金会 AI（LFAI）治理，成为中立的开源社区项目

核心成员：Meta、微软、亚马逊、英特尔、英伟达、AMD、ARM、华为、百度、腾讯等
治理模式：开放社区治理，通过SIG（特别兴趣小组）和WG（工作组）协作，透明决策
核心使命：为机器学习模型定义通用中间表示（IR），让 AI 模型成为可跨平台复用的 “通用资产”

ONNX 格式核心技术规范

ONNX 模型本质是基于Google Protobuf（Protocol Buffers）序列化的二进制文件（后缀.onnx）。其规范（ONNX IR）由三部分构成ONNX：

核心文件结构（Protobuf 定义）

ONNX 模型是一个分层的ModelProto对象：

ModelProto（顶层容器）
- 元数据：IR 版本、算子集版本（Opset）、生产者（如 PyTorch）、文档、许可证
- GraphProto：核心计算图
GraphProto（计算图）
- 有向无环图（DAG），包含：
  - 输入 / 输出（ValueInfoProto）：张量名、数据类型、形状（支持动态维度）。
  - 节点（NodeProto）：算子（Op），如Conv、ReLU、MatMul
  - 初始器（Initializer/TensorProto）：存储权重、偏置等常量参数
    ![[GraphProto（计算图）.jpeg]]

标准算子集（Operator Sets）

核心域（ai.onnx）：定义数百种标准化算子，覆盖 CV、NLP、传统 ML 等
版本化（Opset Version）：算子按版本迭代（如 Opset 24），确保向后兼容ONNX
扩展域：支持自定义域（如ai.onnx.contrib、com.huawei），用于新增算子ONNX

数据类型系统

基础类型：float32、float16、bfloat16、int8/16/32/64、uint8、bool、string。
高级支持：FLOAT8（FP8 E4M3、E5M2）、量化类型、稀疏张量、序列 / 映射等。

核心优势

跨框架互操作性
- 支持：PyTorch、TensorFlow、Keras、MXNet、PaddlePaddle、scikit-learn、XGBoost 等。
- 工作流：训练（A 框架）→ 导出 ONNX → 推理（B 框架 / 引擎）
全平台硬件支持
- 云端：CPU、GPU（NVIDIA/AMD）、TPU、NPU
- 端侧：Android、iOS、WebAssembly、嵌入式、IoT
- 引擎：ONNX Runtime、TensorRT、OpenVINO、TNN、MNN
  ![[全平台硬件支持.jpeg]]
高性能与优化
- 原生支持图优化（常量折叠、算子融合）、量化（INT8/FP16）、剪枝
- ONNX Runtime（ORT）：跨平台高性能推理引擎，硬件厂商深度优化
可扩展与兼容
- 动态形状、控制流（If/Loop）、自定义算子、模型版本转换工具