目前使用CRC32算法 还是有比较大可能性出现碰撞 因此在发现相同的指纹时 再次以原始信息进行比较 在确定原始信息不一致 发生碰撞的前提下 使用另一个固定新初始值对 原始信息进行CRC32计算 获得新的指纹 这个指纹再次比较看是否有相同的指纹 如无则做为指纹保存 如有则再选一固定新初始值对原始信息进行CRC32计算 获得新的指纹 基本三个不同初始值产生的指纹碰撞范围已经超出目前搜索引擎的索引页面数量 足够使用
url信息指纹计算改进
最新推荐文章于 2021-05-06 21:56:12 发布