本文介绍如何使用wireshark和python分别对pcap数据包中的文件内容进行自动和手动的还原。
wireshark在分析数据包的时候,常常会遇到一些wireshark自身无法解码的数据内容,如下图1所示:
图1
这些内容可能是中文编码的文件,图片,视频,往往需要特定的解码软件打开。比如html中如果存在GB2312的中文编码内容,在wireshark中是没法显示的,需要还原成为html格式的文件,使用chrome浏览器打开即可正确的显示。我在这篇文章中曾罗列了众多wireshark中乱码的可能原因,见这里。
图1中图片文件,wireshark也只能解析部分的头部字段,只能显示图片的16进制信息,需要依赖图片解码软件进行显示,视频,office等特定的软件同理。在我前面的文章中讲述了使用wireshark lua插件进行图片,视频,证书等文件内容的提取,见