散列表查找算法

最新推荐文章于 2024-07-11 10:17:27 发布

原创

最新推荐文章于 2024-07-11 10:17:27 发布 · 1k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#散列表 #哈希表 #hashMap hashSet #布隆过滤器

本文介绍了散列表查找算法在海量信息高效检索中的应用，讲解了从暴力搜索到散列表查找的转变，详细阐述了如何实现散列表、解决散列冲突的方法。此外，还探讨了Java中散列表的实现，尤其是HashMap和HashSet。文章进一步讨论了从散列碰撞到hashCode()和equals()的关系，并引入布隆过滤器的概念，分析其优缺点及适用场景，以应对大数据量下的存在性判断问题。

需求场景

散列表一种经典的查找的算法，应用于在海量信息中进行高效检索。

简单需求

假设我们需要把10000000个字符串对象存放在数组中，使用什么存放策略能够快速定位某一个字符串的的数组位置，从而实现快速查找的效果?

暴力搜索

根据原始顺序存放，查找时遍历整个数组进行对比，返回匹配对象的下标
暴力搜索

这样的查找方式，最好的情况是第一次查询时就命中，最坏的情况时查询到数组最后的位置才能找到元素。如果数据量非常大，将会占用很长时间。时间复杂度O(N)

代码实现如下：

public class ViolentSerch {
   
   
    private int capcity;
    private String[] strs;

    public ViolentSerch() {
   
   
        this.capcity = 20000000;
        this.strs = new String[capcity];

        for (int i = 0; i < capcity/2; i++) {
   
   
            strs[i] = "str" + i;
        }
    }

    public int getIndex(String str) {
   
   
        for (int i = 0; i < strs.length; i++) {
   
   
            if (strs[i