这几天一直在做有关病毒样本特征提取的工作,解析出了一个样本病毒特征,今天用python进行了相似样本的检验,想和大家一同分享。
开始是这么写的:
#!/usr/bin/python
import os
import os.path
rootdir = "./sample_Backdoor_Linux"
for filenames in os.walk(rootdir):
for filename in filenames[2]:
record = open(rootdir+"/"+filename,"rb")
link = open("bad virus.txt","r")
str_find = record.read()
print str_find
str_text = link.read()
print str_text
# if str_find.index(str_text) < 0:
# break
# print filenam
运行之后发现根本无法找到病毒样本,为什么(⊙o⊙)?
后来发现了这个让我想揍自己的问题所在,文本中读取出的二进制,并非内存中的二进制,所以根本根本没有可比性,please 记住
于是就有了下面的版本:
#!/usr/bin/python
import os
import os.path
import binascii
rootdir = "./sample_Backdoor_Linux"
def load