看过《文件类型识别的实现思路》文章的朋友应该知道,如果我们通过libmagic返回的描述信息来进行文件识别,有一个麻烦的地方是,我们无法获取到一个完整的文件描述信息列表,因为magic.mgc是二进制文件,我们看不到。
所以我们这里采用一种变通的办法,就是通过文件资源的mime来判断,mime的文件可以在系统的/etc/mime.types中找到,内容示例如下:

比如想识别一个文件是不是jpg,通过查看mime.types文件,我们知道jpg对应的mime是image/jpeg,那么我们可以将文件通过libmagic识别,返回的mime与image/jpeg进行比较,这个比较是字符串的比较,可以用多模AC算法或者是哈希算法,就可以很容易的知道一个文件是不是jpg文件了。
这里还要说一下, 《

文章介绍了如何通过libmagic库结合mime类型来识别文件,特别是通过MAGIC_MIME标志获取文件的mime,然后与预知的mime类型如image/jpeg对比,以此判断文件是否为jpg等特定类型。这种方法适用于当无法直接获取完整文件描述信息时,利用/etc/mime.types中的mime映射进行比较。
最低0.47元/天 解锁文章
532

被折叠的 条评论
为什么被折叠?



