Python实现两个hashmap中键值对值是否相同

探讨Python中字典(dict)作为哈希表的应用,对比开放寻址法与链接法解决哈希冲突的优劣,深入理解Python字典的高效搜索机制。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

由来
最近收到一个关于hashmap的题:

请用代码实现两个hashmap中键值对值是否相同

尝试做了下,发现python没有直接使用hashmap的方法,还需要自己构造,这太麻烦了。
最后发现python本身只有dict这种结构,采用的就是哈希表,我想这应该直接可以拿出来用吧。(没有人指导,只能自己瞎想了)
我是这样写的,直接就可以得到键值对的值相同

a = {
    'x' : 1,
    'y' : 2,
    'z' : 3
}
 
b = {
    'w' : 10,
    'x' : 11,
    'y' : 2
}
print(a.keys() & b.keys())

深入

Python内部很地方都使用着dict这种结构,在对象属性__dict__就是一个字典,所以对其效率要求很高。

dict采用了哈希表,最低能在 O(1)时间内完成搜索。同样的java的HashMap也是采用了哈希表实现,不同是dict在发生哈希冲突的时候采用了开放寻址法,而HashMap采用了链接法。

开放寻址法

优点

  1. 记录更容易进行序列化(serialize)操作
  2. 如果记录总数可以预知,可以创建完美哈希函数,此时处理数据的效率是非常高的

缺点

  1. 存储记录的数目不能超过桶数组的长度,如果超过就需要扩容,而扩容会导致某次操作的时间成本飙升,这在实时或者交互式应用中可能会是一个严重的缺陷
  2. 使用探测序列,有可能其计算的时间成本过高,导致哈希表的处理性能降低
  3. 由于记录是存放在桶数组中的,而桶数组必然存在空槽,所以当记录本身尺寸(size)很大并且记录总数规模很大时,空槽占用的空间会导致明显的内存浪费
  4. 删除记录时,比较麻烦。比如需要删除记录a,记录b是在a之后插入桶数组的,但是和记录a有冲突,是通过探测序列再次跳转找到的地址,所以如果直接删除a,a的位置变为空槽,而空槽是查询记录失败的终止条件,这样会导致记录b在a的位置重新插入数据前不可见,所以不能直接删除a,而是设置删除标记。这就需要额外的空间和操作。

链接法

优点

  1. 对于记录总数频繁可变的情况,处理的比较好(也就是避免了动态调整的开销)由于记录存储在结点中,而结点是动态分配,不会造成内存的浪费,所以尤其适合那种记录本身尺寸(size)很大的情况,因为此时指针的开销可以忽略不计了
  2. 删除记录时,比较方便,直接通过指针操作即可

缺点

  1. 存储的记录是随机分布在内存中的,这样在查询记录时,相比结构紧凑的数据类型(比如数组),哈希表的跳转访问会带来额外的时间开销
  2. 如果所有的 key-value对是可以提前预知,并之后不会发生变化时(即不允许插入和删除),可以人为创建一个不会产生冲突的完美哈希函数(perfect hashfunction),此时封闭散列的性能将远高于开放散列
  3. 由于使用指针,记录不容易进行序列化(serialize)操作

转载:https://zhuanlan.zhihu.com/p/33496977?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值