使用Python进行文件Hash计算有两点必须要注意:
1、文件打开方式一定要是二进制方式,既打开文件时使用b模式,否则Hash计算是基于文本的那将得到错误的文件Hash(网上看到有人说遇到Python的Hash计算错误在大多是由于这个原因造成的)。
2、对于MD5如果需要16位(bytes)的值那么调用对象的digest()而hexdigest()默认是32位(bytes),同理Sha1的digest()和hexdigest()分别产生20位(bytes)和40位(bytes)的hash值
#与java计算出来的值一致
def CalcSha1(self):
with open(self.filename,'rb') as f:
sha1obj = hashlib.sha1()
sha1obj.update(f.read())
hash = sha1obj.digest().encode('base64')
print(hash)
return hash
def CalcMD5(self):
with open(self.filename,'rb') as f:
md5obj = hashlib.md5()
md5obj.update(f.read())
hash = md5obj.hexdigest().encode('base64')
print(hash)
return hash
本文探讨了在Python中计算文件Hash值时需要注意的两个关键点:以二进制模式打开文件以避免错误的Hash计算,以及理解MD5和SHA1的digest()与hexdigest()方法产生的不同位数Hash值。
897

被折叠的 条评论
为什么被折叠?



