使用libpcap解析pcap和pcapng文件

本文介绍了pcap和pcapng两种网络抓包格式,包括它们的文件结构特点,如pcap的固定文件头和块头信息,以及pcapng的可扩展性和支持多接口捕获的特性。还详细阐述了如何使用libpcap库进行离线读取这两种格式的文件,并提供了pcapng转换为pcap的实用方法,包括tcpdump工具的使用和Wireshark软件的另存为功能。此外,文章还给出了一个使用libpcap进行离线读取的C++代码示例。

一 pcap与pcapng特征简介

1.pcap:早期计算机网络抓包格式,几乎所有抓包工具都支持pcap,pcap文件的首四个字节分别是0xd4,0xc3,0xb2,0xa1,pcap文件有文件头和块组成,文件头是固定格式:

struct pcap_file_header {
    uint32_t magic = 0;
    uint16_t max_version = 0;
    uint16_t min_version = 0;
    uint32_t time_zone = 0;
    uint32_t sig_flag = 0;
    uint32_t snap_len = 0;
    uint32_t link_type = 0;
};

块由块头信息和数据信息组成,数据长度由块头信息决定,块头信息定义如下:

struct pcap_pkt_header {
    uint32_t time_sec;
    uint32_t time_usec;
    uint32_t cap_len;
    uint32_t pkt_len;
};

2.pcapng:下一代抓包格式,支持不同路线以寻求标准化,pcapng格式通过使用标准化块和字段来实现可扩展性需求,其特性包括:支持从多个接口捕获,改进时间戳分辨率,在捕获文件插入注释,在捕获文件插入额外元数据等,其基本格式如下:

与pcap不同,pcapng文件首4个字节是0xa,0xd,0xd,0xa。

二 pcapng转pcap

pcapng转pcap方式有很多中,其中列举两种:

1.使用tcpdump:tcpdump -r XXX.pcapng -w XXX.pcap

2.使用wireshark打开pcapng文件后,点击另存为pcap文件即可。

需要注意:不是所有pcapng都可以转pcap文件。

三 libpcap离线读取pcap与pcapng文件接口

libpcap支持在线抓包,也可以使用相应API进行离线抓包:

#include <pcap/pcap.h>
char errbuf[PCAP_ERRBUF_SIZE] = ""; // PCAP_ERRBUF_SIZE为512字节
pcap_t *pcap_open_offline(const char *fname, char *errbuf); // fname可指向pcap或pcapng
pcap_t *pcap_ptr = pcap_open_offline("./xx.pcapng", errbuf);
if (!pcap_ptr) {
    // 如果ptr为空,则说明抓包文件有问题,不是pcap或者pcapng
}
struct pcap_pkthdr pkthdr = { 0 };
/*struct pcap_pkthdr {
        struct timeval ts;      /* time stamp */
        bpf_u_int32 caplen;     /* length of portion present */ // 抓包长度
        bpf_u_int32 len;        /* length this packet (off wire) */ // 时间包长度 caplen <= len
};*/
while (true) {
    const u_char *pkt_buff = pcap_next(pcap_ptr, &pkthdr);  // 循环读取文件
    if (!pkt_buff) {
        std::cerr << "pcapng read over." << std::endl;
        break;
    }
    if (pkthdr.caplen > G_MAX_PCAP_BUFFER_BODY_LEN) {        // 读取文件异常
        std::cerr << "read pcap body error." << std::endl;
        break;
    }
    // pkt_buff执行抓包数据 可进行相关业务处理
    ...
}
pcap_close(pcap_ptr);   // 必须关闭句柄 不然内存泄漏

四 使用libpcap离线读取pcap与pcapng文件客户端

1.功能描述:对指定目录里的pcap和pcapng进行处理

2.代码:https://github.com/wangzhicheng2013/pcapng_file_process

五 使用tcpdump将pcapng转为pcap

tcpdump -r bans3.pcapng -w bans3.pcap

 

### 解析 Wireshark Pcapng 文件 #### 使用 Python 进行解析 对于希望深入挖掘并处理由 Wireshark 抓取的数据包而言,Python 提供了一个强大且灵活的方式去解析 `.pcapng` 文件。Scapy 是一个非常流行的用于创建、发送、嗅探解析网络报文的库;然而当涉及到直接操作捕获文件而不只是实时流量时,pyshark 或者 scapy 的扩展模块如 `scapy.all.rdpcap()` 可能会更加适用。 为了高效地解析 `.pcapng` 文件中的特定字段(比如提到的 comID),可以考虑采用专门为此设计的第三方库——`pyshark` `dpkt` 都是非常不错的选择[^1]。 ```python import pyshark def extract_comid_from_pcapng(file_path): capture = pyshark.FileCapture(file_path) for packet in capture: try: layer = packet['some_layer'] # 替换为实际层名 if hasattr(layer, 'com_id'): print(f"Found COM ID: {layer.com_id}") except KeyError as e: continue capture.close() ``` 这段代码展示了如何利用 PyShark 来遍历给定路径下的 `.pcapng` 文件内的每一个数据包,并尝试从中抽取名为 `com_id` 的属性值。需要注意的是这里的 `'some_layer'` 应该被替换为你所关心的具体协议层次名称。 如果倾向于更低级别的控制,则可以选择 DPKT (Data Link Layer Packet Processing Toolkit),它允许开发者以更细粒度的方式来访问原始字节流: ```python from dpkt import pcapng with open('example.pcapng', 'rb') as f: reader = pcapng.Reader(f) for ts, buf in reader: eth = ethernet.Ethernet(buf) # 假设最外层封装是以太网帧 # 继续向下解码直到找到所需信息... ``` 此方法提供了对每一级链路层头部及其负载部分的完全掌控权,适合那些想要深入了解底层细节的人士[^3]。 #### 转换至经典 PCAP 格式以便简化某些场景下工具兼容性问题 尽管现代大多数分析软件都支持新的 `.pcapng` 格式,但在某些情况下可能仍需将其转换回传统的 `.pcap` 形式。这可以通过调用 Wireshark 自带命令行工具 tshark 实现: ```bash tshark -r input_file.pcapng -F libpcap -w output_file.pcap ``` 上述指令将会把指定输入文件重写成旧版格式保存到新位置,从而使得更多传统应用程序能够无障碍读入这些记录下来的信息[^2]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值