python 计算hash值与java不一致问题

最新推荐文章于 2024-06-23 16:12:59 发布

原创最新推荐文章于 2024-06-23 16:12:59 发布 · 5.7k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#python

python 专栏收录该内容

20 篇文章

订阅专栏

本文探讨了在Python中计算文件Hash值时需要注意的两个关键点：以二进制模式打开文件以避免错误的Hash计算，以及理解MD5和SHA1的digest()与hexdigest()方法产生的不同位数Hash值。

使用Python进行文件Hash计算有两点必须要注意：

1、文件打开方式一定要是二进制方式，既打开文件时使用b模式，否则Hash计算是基于文本的那将得到错误的文件Hash(网上看到有人说遇到Python的Hash计算错误在大多是由于这个原因造成的)。

2、对于MD5如果需要16位(bytes)的值那么调用对象的digest()而hexdigest(）默认是32位(bytes)，同理Sha1的digest()和hexdigest()分别产生20位(bytes)和40位(bytes)的hash值

#与java计算出来的值一致
def CalcSha1(self):
with open(self.filename,'rb') as f:
sha1obj = hashlib.sha1()
sha1obj.update(f.read())
hash = sha1obj.digest().encode('base64')
print(hash)
return hash

def CalcMD5(self):
with open(self.filename,'rb') as f:
md5obj = hashlib.md5()
md5obj.update(f.read())
hash = md5obj.hexdigest().encode('base64')
print(hash)
return hash