命名数据网络 | TLV 编码
命名数据网络 | TLV 编码
参考网站:https://docs.named-data.net/NDN-packet-spec/current/tlv.html
每个 NDN(Named Data Network) 报文以 TLV(Type-Length-Value) 格式编码。NDN 兴趣包(Interest packet)和数据包(Data packet)通过第一个 TLV0 和最外层 TLV0 的类型号来区分。
NDN 报文主要是 TLV0 内部 TLV 的集合。一些 TLV 可能包含子 TLV,每个子 TLV 也可能进一步嵌套。一个指导性的设计原则是保持这些 TLV 的顺序是确定的,并保持嵌套级别尽可能小,以最小化处理开销和出错的机会。
请注意,NDN 包格式没有固定的包头,也没有编码协议版本号。相反,设计使用 TLV 格式来提供随着协议的发展而增加新类型和逐步淘汰旧类型的灵活性。没有固定的报头使得可以有效地支持非常小的数据包,而不需要报头开销。在网络级别也没有数据包碎片支持。在任何需要的时候,NDN 包都可以被逐跳分割和重新组装。
类型和长度的可变大小编码
注意,下面的文本和 NDN TLV 编码部分的文本改编自 Mark Stapp 早期的数据包规范草案。
为了尽量减少早期部署期间的开销,并允许将来的协议扩展灵活地满足不可预见的需求,类型(T)和长度(L)都采用可变大小的格式。为了实现简单,类型和长度都采用相同的编码格式。
我们为 NDN 中的数字定义一个变长编码,如下所示:
VAR-NUMBER-1 = %x00-FC
VAR-NUMBER-3 = %xFD 2OCTET
VAR-NUMBER-5 = %xFE 4OCTET
VAR-NUMBER-9 = %xFF 8OCTET
本规范中 NDN 包格式的正式语法是使用 语法规范的增强 BNF 给出的。
数字的第一个八位字节要么携带实际数字,要么表示存在多八位字节编码,定义如下:
- 如果第一个八位字节小于或等于 252 (0xFC),则在该八位字节中编码数字。
- 如果第一个字节是 253 (0xFD),则数字按网络字节顺序编码为接下来的 2 个字节。这个数字必须大于 252 (0xFC)。
- 如果第一个字节是 254 (0xFE),则该数字按网络字节顺序编码为接下来的 4 个字节。该数字必须大于 65535 (0xFFFF)。
- 如果第一个字节为 255 (0xFF),则该数字按照网络字节顺序编码为后面的 8 个字节。该数字必须大于 4294967295 (0xFFFFFFFF)。
NDN TLV 编码
NDN 报文的 TLV 编码定义如下:
NDN-TLV = TLV-TYPE TLV-LENGTH TLV-VALUE
TLV-TYPE = VAR-NUMBER-1 / VAR-NUMBER-3 / VAR-NUMBER-5
TLV-LENGTH = VAR-NUMBER-1 / VAR-NUMBER-3 / VAR-NUMBER-5 / VAR-NUMBER-9
TLV-VALUE = *OCTET
TLV-TYPE 必须在 [1,4294967295] 范围内。类型 0 被保留来指示无效的 TLV 元素,并且绝对不能出现在线路上。TLV-TYPE 在所有嵌套层中应该是唯一的。
TLV-LENGTH 字段表示 TLV-VALUE 使用的字节数。它不包括 TLV-TYPE 和 TLV-LENGTH 字段本身占用的字节数。特别地,一个空值的 TLV 元素的 TLV-LENGTH 将等于 0。
这种编码在紧凑性和灵活性之间提供了一个合理的平衡。最常见的是,标准化的 TLV-TYPE 数值将从一个小整数数字空间分配,这些常见的类型将能够使用紧凑的单字节编码。
非负整数编码
NDN 报文格式中的许多 TLV 元素都以非负整数作为 TLV-VALUE,定义如下:
NonNegativeInteger = 1OCTET / 2OCTET / 4OCTET / 8OCTET
包含 NonNegativeInteger 的 TLV 元素的 TLV-LENGTH 必须为 1、2、4 或 8。根据 TLV-LENGTH 的不同,NonNegativeInteger 的编码方式如下:
- 如果长度为 1,则 NonNegativeInteger 以 1 个八位字节编码;
- 如果长度为 2,则 NonNegativeInteger 按网络字节顺序编码为 2 个八位字节;
- 如果长度为 4,则 NonNegativeInteger 按网络字节顺序编码为 4 个八位字节;
- 如果长度为 8,则 NonNegativeInteger 按网络字节顺序编码为 8 个字节。
下面展示了一些以十六进制格式(其中 TT 表示 TLV-TYPE,然后是 TLV-LENGTH,然后是 TLV-VALUE)作为其值组件的 TLV 示例:
0 => TT0100
1 => TT0101
255 => TT01FF
256 => TT020100
65535 => TT02FFFF
65536 => TT0400010000
基于 TLV 的编码可演化性的思考
为了确保基于 TLV 的协议可以随时间发展,TLV-TYPE 的最低有效位(除非被特定网络/库/应用程序 TLV 元素的规范覆盖)被保留,以指示该 TLV 元素是关键还是非关键。一个兼容的 TLV 格式解码器应该遵循相应规范中定义的已识别元素的顺序、数量和存在要求。同时,如果解码器遇到无法识别或无序的元素,其行为应如下所示:
- 如果元素的 TLV-TYPE 编号的最低有效位为 1,则中止解码并报告错误;
- 如果元素的 TLV-TYPE 编号的最低有效位为 0,则忽略该元素并继续解码;
- 在 [0,31] 范围内的 TLV-TYPE 编号是“祖父号”,并且都被指定为数据包处理的关键号。
如果已识别的元素以违反规范的元素顺序出现,则认为它是无序的。
例如:
- 当规范定义了序列 {F1 F2 F3} 时,元素 F3 在序列 {F1 F3 F2} 中是乱序的;
- 对于 {F1 F2?F3} 规范,即当 F2 为可选时,F2 将在相同的序列 {F1 F3 F2} 中乱序。