TLV数据格式及解析

本文详细分析了TLV(Tag, Length, Value)数据格式,特别是在PBOC/EMV标准中的简化版。讲解了TLV中tag域的编码规则,包括单一数据与复合数据结构的区别,并提供了简单的解码伪代码。同时提到了Length域的编码,以及Value域的解码需要根据具体数据元决定。最后指出,通过这些知识可以构建一个TLV解码器。" 107782507,7530276,无缝升级openssh与openssl:不干扰旧版本,"['系统管理', '安全更新', 'Linux', '软件升级', 'openssh']

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

TLV数据格式

几乎所有的需要在卡片和终端之间传送的数据都是TLV格式的. PBOC文档里并没有对TLV编码细节做具体说明, 而EMV的手册里虽有叙述,但并不详细. 我下面就要很详细的分析TLV的编码格式并给出相应的TLV解码的伪代码.
TLV是tag, length和value的缩写.一个基本的数据元就包括上面三个域. Tag唯一标识该数据元, length是value域的长度. Value就是数据本身了. 举个例子, 下面是一个tlv格式的AID(应用标识符)字节串”9F0607A0000000031010”, 其中9F06是tag, 07是长度, A0000000031010就是AID本身的值了.
对于程序编写人员来说,我们关心的是,如果有类似上面这样的一串TLV编码的字节串从卡片传过来, 怎么样从中提取我们想要的数据. 这就牵扯出TLV解码的问题了.
其中BER-TLV编码是ISO定义一种规范, 然后到了PBOC/EMV里被简化了, 哪里被简化了呢?举一个例子, tag域在ISO里可以有多个字节, 而PBOC/EMV里规定只用前两个字节. 我下面要讲的TLV解码就是基于PBOC/EMV的简化版本.
首先看一下tag域是怎样编码的. Tag域占最多占两个字节. 编码规则如下面两幅图:
图一
图二
解释一下这两幅图. 第一个图是第一个字节的编码规则. b8和b7两位标识tag所属类别. 这个可以暂时不用理. b6决定当前的TLV数据是一个单一的数据和复合结构的数据. 复合的TLV是指value域里也包含一个或多个TLV, 类似嵌套的编码格式. b5~b1如果全为1,则说明这个tag下面还有一个子字节. 占两个字节, 否则tag占一个字节.
第二幅图是说明如果tag占用两个字节, 第二个字节的编码格式. B8决定tag是否还有后绪的字节存在,因为前面说过,PBOC/EMV里的tag最多占两个字节, 所以该位保持为0.
清楚了上面tag编码格式,可很容易写出tag域解码的代码了. 假设,终端接收到一人字节串,这个字节串保存在tlvData的字节数组里, 伪代码如下:
if ( (tlvData[i]&0x20) != 0x20)//单一结构
{
if ( (tlvData[i]&0x1f) == 0x1f)//tag两字节
{
tagIndex++;
//解析length域
//解析value域
}
else//tag单字节
{
//解析length域
//解析value域
}
}
else//复合结构
{
//复合结构可以考虑用递归的方法来实现.
}
Length域的编码比较简单,最多有四个字节, 如果第一个字节的最高位b8为0, b7~b1的值就是value域的长度. 如果b8为1, b7~b1的值指示了下面有几个子字节. 下面子字节的值就是value域的长度.
Value域的编码格式要根据具体的value所表示的数据元决定. 比如AID是由RID+PIX构成等. 这个不详述. 有了上面的知识,基本上可以写一个TLV解码器出来了。
一个字节有八位,一个数字或字母只有4位,两位数字或字母或一个数字一个字母代表一个字节。

代码解析如下

#include<stdio.h>
#include<string.h>
#include<
### TLV 数据格式详解 #### TLV 结构概述 TLV(Tag-Length-Value)是一种用于数据序列化的通用格式,广泛应用于各种通信协议中。这种格式由三个部分组成: - **标签域 (Tag)**:标识特定的数据字段类型。 - **长度域 (Length)**:指定后续值域的大小。 - **内容域 (Value)**:实际存储的数据。 在金融系统中使用的TLV通常是基于BER-TLV编码标准的一种特例[^1]。 #### 长度域解释 对于长度域而言,在某些情况下其表示方式会有所不同。当子域取值长度超过一定范围时,L字段可能占用多个字节来表达更长的内容区段。例如,如果L字段为“1000 0001 1111 1111”,则意味着该子域占据255个字节;因此,若子域长度介于127到255字节之间,则L字段需要两个字节来描述[^2]。 #### 解析过程示例 下面是一个简单的Java代码片段展示如何解析基本形式下的TLV字符串: ```java public class TlvParser { public static void main(String[] args) throws Exception{ String input = "AABBCC"; // 假设这是十六进制编码后的TLV串 int index = 0; while(index < input.length()){ // 获取tag, length 和 value 的起始位置 String tagStr = input.substring(index, Math.min(input.length(),index+4)); Integer lengthInt = Integer.parseInt( input.substring(Math.min(input.length(),index+4),Math.min(input.length(),index+8)),16); String valueStr = input.substring(Math.min(input.length(),index+8), Math.min(input.length(),index+8+(lengthInt*2))); System.out.println("Tag:"+tagStr+", Length:"+lengthInt+", Value:"+valueStr); // 更新索引以便处理下一个TLV项 index += 8 + (lengthInt * 2); } } } ``` 此程序仅适用于简单场景下固定宽度tags和单字节lengths的情况,并未考虑多字节长度或其他复杂特性如不定长编码等高级功能。要实现完整的TLV解析器还需要支持更多细节上的差异以及错误检测机制。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值