python hash及dict()实现原理

python hash及dict()实现原理

哈希(散列)

dict() 实现原理

ref

Python 中的哈希表:对字典的理解

Python之哈希表

hash 定义

力扣应用

note

哈希操作:

  • f ( x ) − − − > y f(x) ---> y f(x)>y

    • f ( ) f() f():哈希函数
    • y y y:哈希值
  • 单向不可逆

  • 当不同 x x x经过哈希操作后得到了相同的哈希值 y y y,则叫做冲突

    解决冲突:

    • open addressing 开放寻址法
    • separate chaining 链地址法

哈系表:

  • 一种存储键值对数据的数据结构
  • 通过 k e y key key的哈希操作得到 v a l u e value value
  • 查找哈希表的花费时间与哈希表存储的数据多少无关

python dict实现原理:

Python字典dict实现原理

哈希表结构:

entries = [
    ['--', '--', '--'],
    [hash, key, value],
    ['--', '--', '--'],
    ['--', '--', '--'],
    [hash, key, value],
]

大致流程:

  • 通过 k e y key key的哈希操作得到哈希值 h a s h hash hash
  • h a s h hash hashlen(entries)-1(哈希表的长度减一)相与,得到存储下标 i n d e x index index
    • 改进如下:
      • 也可以增加一个index_list列表,用于记录数据在哈希表中的下标
        • h a s h hash hashlen(entries)-1(哈希表的长度减一)相与,得到存储下标 i n d e x index index在index位置存入当前的len(entries),相当于记录在哈希表中数据的下标
      • 将哈希表的稀疏性转接到index_list列表,节省空间
  • 存入数据
  • 动态扩展哈希表时,所有的hash重新计算并重新存储

总结:

  • 老算法:
    • 只维护一张哈希表
    • 表稀疏浪费空间
  • 新算法
    • 增加一个index_list列表
    • 将哈希表的稀疏性转接到index_list列表,节省空间
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值