- 博客(3)
- 收藏
- 关注
原创 实验课7-2开源情报之URL查重简化版-散列表查找
开源情报是指通过公开可用的数据和信息获取情报。随着信息技术的发展,互联网已成为各类情报组织的主要工具之一。在互联网上通过URL访问网站,开源情报系统通过海量的URL搜集信息,这些URL存在大量的重复,通过散列表可以快速的实现,目前实现中常用布隆过滤器的判重方式。本题中,为了简化编程,假设URL已经通过函数转换成了整数,并且采用简单的散列表实现。设散列表a[18],散列函数是hash(k)=k%17,用开放地址法解决冲突hi=(h0+di)%m。
2024-07-05 08:42:20
417
原创 实验课7-1开源情报之URL查重简化版-散列表构造
开源情报是指通过公开可用的数据和信息获取情报。随着信息技术的发展,互联网已成为各类情报组织的主要工具之一。在互联网上通过URL访问网站,开源情报系统通过海量的URL搜集信息,这些URL存在大量的重复,通过散列表可以快速的实现,目前实现中常用布隆过滤器的判重方式。本题中,为了简化编程,假设URL已经通过函数转换成了整数,并且采用简单的散列表实现。设散列表a[18],散列函数是hash(k)=k%17,用开放地址法解决冲突hi=(h0+di)%m。冲突时采用平方探测法,使用增量序列di=i2。
2024-07-05 08:22:55
236
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人