手把手带你手撕HashMap

本文详细探讨了HashMap的优缺点,包括其快速的增删查操作以及在数据重复和无序性方面的局限。同时,介绍了四种解决哈希冲突的方法,如开放地址法、链表法等,并通过实例展示了如何手撕HashMap,实现了一个基于双向链表的HashMap数据结构,用于存储键值对。

HashMap的优缺点

优点

  • 增删查找时间复杂度o(1)

缺点

  • key不能重复,在数据很多相同的时候不适合
  • 里面的内容是随机的不是有序的,所以面对有序的处理不行,比如说顺序输出
  • 还有就是要知道数组开辟的大小,如果开辟小了,hash冲突的很严重那么链表查询的时候时间就会增加,这时候就要扩容,那么里面所有的hash都需要重新进行hash存储了

怎么解决hash冲突

  • 开放地址法 (冲突了往下找)
  • 链表法 (数组里面放的是链表,这也是我们手撕的)
  • 公共溢出区法
  • 再hash法(就是在hash一次)

手撕hashmap

其实就是里面有一个数组(指针数组),里面放的是双向链表,双向链表里面放的是一个pair,pair里放的是key,value,单向的也可以(单向的删除要找的是删除元素的上一个,双向的找对应的就好)

class MyHashMap {
public:

   static int hsah(int key) {
        return key%size;
    }

    /** Initialize your data structure here. */
    MyHashMap():mymap_(size) {
    }
    
    /** value will always be non-negative. */
    void put(int key, int value) {
        int index = hsah(key);
        // cout<<"put"<<endl;
        // cout<<"index: "<<index<<endl;
        auto iter = mymap_[index].begin();
        while(iter!=mymap_[index].end()) {
            if(iter->first==key) {
                iter->second=value;
                return;
            }
            iter++;
        }
        mymap_[index].insert(mymap_[index].end(),{key,value});
    }
    
    /** Returns the value to which the specified key is mapped, or -1 if this map contains no mapping for the key */
    int get(int key) {
        // cout<<"get: "<<key<<endl;

        int index = hsah(key);
        // for(auto i = mymap_[index].begin();i!=mymap_[index].end();i++) {
        //     cout<<i->first<<" "<<i->second<<" | ";
        // }
        // cout<<endl;

        auto iter = mymap_[index].begin();
        for(;iter!=mymap_[index].end();iter++) {
            if(iter->first==key) {
                return iter->second;
            }
        }
        return -1;

    }
    
    /** Removes the mapping of the specified value key if this map contains a mapping for the key */
    void remove(int key) {
        // cout<<"remove"<<endl;

        int index = hsah(key);
        for( auto iter = mymap_[index].begin();iter!=mymap_[index].end();iter++) {
            if(iter->first==key) {
                iter=mymap_[index].erase(iter); // 后面的迭代器虽然不会失效但是不能用++了
                // iter--;
                return;
            }
        }
    }


private:
    vector<list<pair<int,int>>> mymap_;
    static const int size = 572;


};

/**
 * Your MyHashMap object will be instantiated and called as such:
 * MyHashMap* obj = new MyHashMap();
 * obj->put(key,value);
 * int param_2 = obj->get(key);
 * obj->remove(key);
 */
### 回答1: HashMap 是 Java 中一种非常常用的数据结构,它是基于哈希表实现的一种键值对映射容器。 在 HashMap 中,每个元素都有一个唯一的键和一个对应的值。通过哈希函数对键进行散列,可以快速地在哈希表中定位到对应的值,因此 HashMap 具有非常高效的查找速度。 当往 HashMap 中添加元素时,它会根据键的哈希值计算出对应的桶(bucket)的位置,然后将键值对存储在桶中。如果多个键的哈希值相同,那么它们会被存储在同一个桶中,这时候需要通过链表或红黑树等数据结构来存储这些键值对,以避免哈希冲突。 HashMap 的常用操作包括添加元素、获取元素、删除元素等,其时间复杂度均为 O(1)。不过,当哈希表中的元素数量达到一定阈值时,为了避免哈希冲突过多而导致性能下降,HashMap 会自动进行扩容操作。 需要注意的是,由于哈希表是无序的,因此 HashMap 中的元素是没有顺序的。如果需要有序的键值对映射容器,可以考虑使用 TreeMap 等其他数据结构。 ### 回答2: HashMap是Java中常用的数据结构之一,它是一个键值对存储的集合。它的实现原理是基于哈希表,使用键的哈希码进行索引,能够快速地根据键找到对应的值。以下是我对HashMap的理解。 首先,HashMap允许使用null作为键和值,但是建议尽量避免使用null键,因为它在哈希表中的索引位置不确定,可能会导致性能下降。 其次,HashMap的put和get操作的时间复杂度都是O(1),即常数时间复杂度。这是因为HashMap内部使用一个数组来存储元素,通过计算键的哈希码,将其映射到数组的索引位置,从而可以直接访问到对应的值,而不需要遍历整个集合。 另外,当HashMap的负载因子超过设定的阈值时,会触发扩容操作。扩容会重新计算键的哈希码,并重新分配数组,以提高HashMap的效率和容量。 需要注意的是,HashMap并不是线程安全的,如果多个线程同时对HashMap进行修改,可能会导致数据不一致。如果需要在多线程环境中使用HashMap,可以使用ConcurrentHashMap或者动进行同步操作来保证线程安全。 此外,HashMap的遍历是无序的,因为它是根据键的哈希码来存储和访问数据的。如果需要有序的遍历,可以使用LinkedHashMap,它保持元素的插入顺序或访问顺序。 最后,使用HashMap时需要注意键的hashCode和equals方法的正确实现,以确保键的唯一性和正确的存取。 总的来说,HashMap是一个高效的数据结构,能够快速地根据键找到对应的值。我们可以利用它来实现缓存、查找等常见的功能。但是在使用过程中需要注意线程安全和哈希码等细节的处理,以避免潜在的问题。 ### 回答3: HashMap是Java中的一种数据结构,它实现了Map接口。它是基于哈希表的,使用键值对的方式存储数据。我对HashMap的理解主要有以下几点: 首先,HashMap使用哈希函数将存放的键映射到存储桶的索引上。这样可以通过键快速定位到存储的值,提高了数据的访问效率。不同的键可能会映射到相同的索引,这就是哈希碰撞。HashMap通过链表或红黑树的形式解决了哈希碰撞的问题,确保了高效的查找和插入操作。 其次,HashMap允许存放null值和null键。它使用equals()方法判断两个键是否相等,使用hashCode()方法计算键的哈希码。为了提高效率,好的HashMap应该具有良好的散列分布,即尽量避免哈希碰撞,使得键尽可能均匀地分布在各个存储桶中。 此外,HashMap是非线程安全的,不适用于多线程环境。如果需要在多线程环境下使用,可以考虑使用ConcurrentHashMap,它提供了线程安全的操作。 最后,HashMap的容量会根据实际存储的键值对数量动态扩容和收缩。当HashMap的大小超过负载因子与当前容量的乘积时,会自动扩容。扩容后,原有的键值对需要重新计算哈希码和存放到新的存储桶中,这会增加一定的开销。因此,在使用HashMap时,需要合理设置负载因子,避免频繁的扩容操作。 总之,HashMap是一种高效的数据结构,提供了快速的查找和插入操作。但是,需要注意其不是线程安全的,而且在使用时需要注意负载因子和散列分布的优化。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值