爬取的页面如何判断是否更新

哈希函数

第一获取:
import hashlib

md5 = hashlib.md5()

md5.update('qianfengpython'.encode('utf-8'))

print(md5.hexdigest())

输出:2b036a15be73f4446e661d95e8e9603c

比较时需要再次创建一个md5,如果没有再次创建,直接md5.update()则会再原来的基础上更新,哈希出来的哈希值一定不同

第二次获取:
md5_compare = hashlib.md5()

md5_compare.update('qianfengpython'.encode('utf-8'))

print(md5_compare.hexdigest())

输出为:2b036a15be73f4446e661d95e8e9603c

两者相同

注意:
使用以下命令:
md5.update(‘qianfengpython’)

报以下错:
Traceback (most recent call last):
File “”, line 1, in
TypeError: Unicode-objects must be encoded before hashing

再用:
md5.update(‘qianfengpython’.encode(‘utf-8’))

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值