主要问题:
ONNX 模型在底层是用什么格式存储的?
如何不依赖深度学习框架,只用 ONNX 的 API 来构造一个 ONNX 模型?
如果没有源代码,只有一个 ONNX 模型,该如何对这个模型进行调试?
ONNX 的底层实现
存储格式
ONNX的底层是用 Protobuf 定义的。是 Google 提出的一套表示和序列化数据的机制。
对于 ONNX ,它的 Protobuf 数据定义文件在其开源库中,这些文件定义了神经网络中模型、节点、张量的数据类型规范。
ONNX 提供了很多实用 API,我们可以在完全不了解 Protobuf 的前提下,构造和读取 ONNX 模型。
结构定义
图一般是用一个节点集和一个边集表示的。
神经网络本质上是一个计算图。计算图的节点是算子,边是参与运算的张量。
可视化 ONNX 模型, 能看到所有算子节点的属性信息,参与运算的张量信息存储在算子节点的输入输出信息中。
一个 ONNX 模型可以用 ModelProto 类表示。
ModelProto 包含了版本、创建者等日志信息,还包含了存储计算图结构的 graph。
GraphProto 类则由输入张量信息、输出张量信息、节点信息组成。
张量信息 ValueInfoProto 类包括张量名、基本数据类型、形状。
节点信息 NodeProto 类包含了算子名、算子输入张量名、算子输出张量名。
ModelProto模型信息{GraphProto图信息{NodeProto节点信息, ValueInfoProto节点信息}}
下面演示实现 output=a*x+b 功能的ONNX模型
ir_version:8,
graph{
node {
input: "a",input: "x",output: "c",op_type: "Mul"},
node {
input: "c",input: "b",output: "output",op_type: "Add"},
name: "linear_func",
input {
name: "a",
type {
tensor_type {
elem_type: 1,
shape {
dim {
dim_value: 10}, dim {
dim_value: 10}}
}}
},
input {
name: "x",
type {
tensor_type {
elem_type: 1,
shape {
dim {
dim_value: 10}, dim {
dim_value: 10}}
}}
},
input {
name: "b",
type {
tensor_type {
elem_type: 1,
shape {
dim {
dim_value: 10}, dim {
dim_value: 10}}
}}
},
output {
name: "output",
type {
tensor_type {
elem_type: 1,
shape {
dim {
dim_value: 10}, dim {
dim_value: 10}}
}}
}
},
opset_import {
version: 15}
读写 ONNX 模型
构造 ONNX 模型
完全用 ONNX 的 Pyth