【Python 数据结构 15.哈希表】

目录

一、哈希表的基本概念

1.哈希表的概念

2.键值对的概念

3.哈希函数的概念

4.哈希冲突的概念

5.常用的哈希函数

Ⅰ、直接定址法

Ⅱ、平方取中法

Ⅲ、折叠法

Ⅳ、除留余数法

Ⅴ、位与法

6.哈希冲突的解决方案

Ⅰ、开放定址法

Ⅱ、链地址法

7.哈希表的初始化

8.哈希表的元素插入

9.哈希表的元素删除

10.哈希表的元素查找

二、Python中的哈希表

1.哈希表的创建(字典)

2.哈希表的元素修改

Ⅰ、元素的索引

Ⅱ、元素的添加

Ⅲ、元素的删除

Ⅳ、元素的修改

3.哈希表的查找与遍历

Ⅰ、通过键查找值

Ⅱ、遍历哈希表的键

Ⅲ、遍历哈希表的值

Ⅳ、遍历哈希表的键和值 

三、代码实战

1512. 好数对的数目

方法一、哈希表

思路与算法

方法二、二重循环

思路与算法

961. 在长度 2N 的数组中找出重复 N 次的元素

方法一、哈希表

思路与算法

​编辑

1207. 独一无二的出现次数

方法一 哈希表

思路与算法


你每次都会自己站起来,这次又怎会是意外

                                                                —— 25.3.13

一、哈希表的基本概念

1.哈希表的概念

        哈希表又叫散列表,我们需要把查找的数据通过一个函数映射,找到存储数据的位置,这个过程被称为哈希。需要查找的数据本身被称为关键字,通过一个函数映射将关键字变成哈希值的过程,这里的函数被称为哈希函数

        生成哈希值的过程可能产生冲突(两个关键字通过一个哈希函数后得到的哈希值相同),需要进行冲突解决,解决完冲突以后,实际存储数据的位置被称为哈希地址。通俗的说,它就是一个数组下标存储所有这些数据的表,就被称为哈希表

        为了方便索引,哈希表底层实现结构是一个顺序表,每个位置被称为一个槽,存储一个键值对。以下就是一个长度为 8 的哈希表:


2.键值对的概念

        键值对由组成,键和值都可以是任意类型(比如整型、浮点型、字符串、类 等等)。

        哈希表的实现过程中,我们需要通过一些手段将一个非整型的键转换成整数,也就是哈希值,从而通过 O(1) 的时间快速索引到它对应在哈希表中的位置。而将一个非整形的关键字转换成整型的手段,就是哈希函数


3.哈希函数的概念

        哈希函数可以理解为小学课本上的那个函数 y=f(x),这里的 f(x) 就是哈希函数。x 是键,y 是哈希值。好的哈希函数应该具备两个特征:(1)单射 (2)雪崩效应

        单射:哈希值 y 与 键 x 一一对应

        雪崩效应:为了让哈希值,更加符合随机分布的原则,哈希表中的键分布的越随机,利用率越高,效率也越高。


4.哈希冲突的概念

        哈希函数在生成哈希值的过程中,如果不同的关键字传入哈希函数后得到相同的哈希值,就被称为 哈希冲突


5.常用的哈希函数

Ⅰ、直接定址法

        直接定址法就是:键本身就是哈希值,表示成函数就是 f(x) = x,例如计数排序的原理,采用的就是直接定址法。由于哈希值是需要映射到顺序表中作为索引的,所以直接定址法只能处理数据量较小的且为非负整数的键。

Ⅱ、平方取中法

        平方取中法就是对键进行平方运算,再取中间的某几位作为哈希值例如:对于键 1314 平方后得到 1726596,取中间三位作为哈希值,即 265。平方取中法比较适合于不清楚键的分布,且位数不是很大的情况。

Ⅲ、折叠法

        折叠法是将关键字分割成位数相等的几部分,然后再进行求和,得到一个哈希值。例如:对于关键字 5201314,将它分为四组,并且相加得到52+01+31+4=88,这个就是哈希值。

Ⅳ、除留余数法

        除留余数法,就是 键的值上哈希表长度,表示成函数 f(x) = x mod m,其中 m 代表了哈希表的长度。这种方法,不仅可以对关键字取模,也可以在平方取中法、折叠法之后再取模。

        例如:对于一个长度为 4 的哈希表,可以将关键字 模4 得到哈希值。而这个方法也是我们要重点介绍的方法。

Ⅴ、位与法

        哈希表的长度一般选择 2 的幂

        取模运算比较耗时,而位运算相对较高效,选择 2 的幂作为哈希表长度,可以将取模运算 转换成 二进制位与,令 m 等于 2 的 k 次,其二进制表示为:

        任何一个数模上 m,相当于取了 m 的二进制的低 k 位:

        m 的模运算 与 m - 1 的位于运算效果是一样的:x % S == x & (S - 1)

        除了直接定址法,其他方法都可能导致哈希冲突


6.哈希冲突的解决方案

        解决哈希冲突的主要两种方法:开放定址法链地址法,无论是开放地址法,还是链地址法,都可以实现哈希表,我们只需要选择其中一种即可。

Ⅰ、开放定址法

        开放定址法就是一旦发生冲突,就去寻找下一个空的地址,只要哈希表足够大,总能找到一空的位置,并且记录下来作为它的哈希值,公式:

d_i是一个数列,可以是常数列,也可以是等差数列

        哈希表的每个数据就是一个键,插入之前需要先进行查找,如果找到的位置未被插入则执行插入,否则找到下一个未被插入的位置进行插入。

        这种方法需要注意的是:当插入数据超过哈希表长度时,不能再执行插入,否则会造成死循环。

Ⅱ、链地址法

        当产生冲突后,我们也可以选择不换位置,还是在原来的位置,只是把 哈希值 相同的用链表串联起来,这种方法被称为链地址法。

        哈希表的每个数据,保留了链表头结点和尾结点,插入前需要先进行查找,如果找到的位置链表非空,则插入尾结点,并且更新尾结点。否则生成一个新的链表头结点和尾结点。


7.哈希表的初始化

        给定一个大小 n,申请一个 n 个元素的数组,元素类型是:哈希表键值对


8.哈希表的元素插入

     给定元素,利用哈希函数计算它的哈希值,对数组长度 n 取模以后,找到合适的位置,遍历这个位置上的链表,如果发现没有键值对相等的元素,则插入这个链表   


9.哈希表的元素删除

        给定元素,利用哈希函数计算它的哈希值,对数组长度 n 取模以后,找到合适的位置,遍历这个位置上的链表,如果发现有键值对相等的元素,则从链表上进行删除


10.哈希表的元素查找

        给定元素,利用哈希函数计算它的哈希值,对数组长度 n 取模以后,找到合适的位置,遍历这个位置上的链表,如果发现键值对相等的元素,返回 True;否则,返回 False。


二、Python中的哈希表

1.哈希表的创建(字典)

hash = {}
hash = {"e":3, "t":6, "a":1, "o":4, "i":5, "n":2}
print(hash)


2.哈希表的元素修改

Ⅰ、元素的索引

hash['u'] = 9
print(hash)

hash['u'] = 4
print(hash)


Ⅱ、元素的添加

hash['z'] = 13
print(hash)


Ⅲ、元素的删除

hash.pop():用于移除字典中指定键的项,并返回该键对应的值。如果指定的键不存在,可提供一个默认值,否则会引发 KeyError 异常。

参数名类型是否必需描述
key任意可哈希类型需要从字典中移除的键
default任意类型如果指定的键不存在时返回的默认值,默认为 None
hash.pop('o')
print(hash)


Ⅳ、元素的修改

hash['z'] += 1

print(hash['z'])


3.哈希表的查找与遍历

Ⅰ、通过键查找值

hash.get():用于返回指定键的值。如果键存在于字典中,则返回对应的值;如果键不存在,则返回默认值(默认为 None),不会引发 KeyError 异常。

hash.get(x, 0) + 1:通过遍历列表 nums,使用哈希表(字典)hash 可以统计每个元素的出现次数。

参数名类型是否必需描述
key任意可哈希类型需要查找值的键
default任意类型如果指定的键不存在时返回的默认值,默认为 None
print(hash.get('x', 9))

Ⅱ、遍历哈希表的键

hash.keys():返回一个视图对象,该对象包含了字典中所有的键。

for k in hash.keys():
    print(k, end = " ")


Ⅲ、遍历哈希表的值

hash.values(): 返回一个视图对象,该对象包含了字典中所有的值。

for v in hash.values():
    print(v, end = " ")


Ⅳ、遍历哈希表的键和值 

hash.items():返回一个视图对象,该对象包含了字典中所有的键值对,每个键值对以元组的形式表示。

for k,v in hash.items():
    print(k, v, end = " ")


三、代码实战

1512. 好数对的数目

给你一个整数数组 nums 。

如果一组数字 (i,j) 满足 nums[i] == nums[j] 且 i < j ,就可以认为这是一组 好数对 。

返回好数对的数目。

示例 1:

输入:nums = [1,2,3,1,1,3]
输出:4
解释:有 4 组好数对,分别是 (0,3), (0,4), (3,4), (2,5) ,下标从 0 开始

示例 2:

输入:nums = [1,1,1,1]
输出:6
解释:数组中的每组数字都是好数对

示例 3:

输入:nums = [1,2,3]
输出:0

提示:

  • 1 <= nums.length <= 100
  • 1 <= nums[i] <= 100

方法一、哈希表

思路与算法
  1. 哈希表记录频次:使用字典(哈希表)hash 记录每个元素已出现的次数。
  2. 累加配对数:遍历数组时,对于当前元素 x,检查它之前已出现的次数 hash.get(x, 0),将这些次数累加到 count 中(每次出现的新元素会与之前所有相同元素形成新对)。
  3. 动态更新频次:将当前元素 x 的出现次数加 1,更新到哈希表中。

关键点:每个元素 x 在遍历时,仅统计它之前出现的次数,从而避免重复计数。

class Solution:
    def numIdenticalPairs(self, nums: List[int]) -> int:
        hash = {}
        n = len(nums)
        count = 0
        for i in range(n):
            x = nums[i]
            count += hash.get(x, 0)
            hash[x] = hash.get(x, 0) + 1
        return count


方法二、二重循环

思路与算法

此方法为暴力解法,通过双重循环遍历数组中所有可能的索引对 (i, j)(其中 i < j),直接比较元素是否相等。若相等则计数器 count 加 1。

关键点

  • 时间复杂度高,但逻辑简单直观。
  • 适用于小规模数据,但对大规模数据效率极低。
class Solution:
    def numIdenticalPairs(self, nums: List[int]) -> int:
        n = len(nums)
        count = 0
        for i in range(n):
            for j in range(i + 1, n):
                if nums[i] == nums[j]:
                    count += 1
        return count


961. 在长度 2N 的数组中找出重复 N 次的元素

给你一个整数数组 nums ,该数组具有以下属性:

  • nums.length == 2 * n.
  • nums 包含 n + 1 个 不同的 元素
  • nums 中恰有一个元素重复 n 次

找出并返回重复了 n 次的那个元素。

示例 1:

输入:nums = [1,2,3,3]
输出:3

示例 2:

输入:nums = [2,1,2,5,3,2]
输出:2

示例 3:

输入:nums = [5,1,5,2,5,3,5,4]
输出:5

提示:

  • 2 <= n <= 5000
  • nums.length == 2 * n
  • 0 <= nums[i] <= 104
  • nums 由 n + 1 个 不同的 元素组成,且其中一个元素恰好重复 n 次

方法一、哈希表

思路与算法

① 遍历列表统计列表中元素及其出现次数

② 遍历哈希表,找到频次等于 n // 2的元素

class Solution:
    def repeatedNTimes(self, nums: List[int]) -> int:
        hash = {}
        for x in nums:
            hash[x] = hash.get(x, 0) + 1
        for k, v in hash.items():
            if v == len(nums) // 2:
                return k


1207. 独一无二的出现次数

给你一个整数数组 arr,如果每个数的出现次数都是独一无二的,就返回 true;否则返回 false

示例 1:

输入:arr = [1,2,2,1,1,3]
输出:true
解释:在该数组中,1 出现了 3 次,2 出现了 2 次,3 只出现了 1 次。没有两个数的出现次数相同。

示例 2:

输入:arr = [1,2]
输出:false

示例 3:

输入:arr = [-3,0,1,-3,1,1,1,-3,10,0]
输出:true

提示:

  • 1 <= arr.length <= 1000
  • -1000 <= arr[i] <= 1000

方法一 哈希表

思路与算法

统计频次:使用字典 count 统计每个元素的出现次数。

检查重复:使用字典 hash 记录已出现的次数值。若某次数的值已存在,则说明有重复,直接返回 False;否则继续遍历。

最终判定:若所有次数均无重复,返回 True

将测试用例代入哈希表流程进行实验:

class Solution:
    def uniqueOccurrences(self, arr: List[int]) -> bool:
        count = {}
        # arr = [1,2,2,1,1,3]
        for i in arr:
            # count[1] = 1
            # count[2] = 1
            # count[2] = 2
            # count[1] = 2
            # count[1] = 3
            # count[3] = 1
            count[i] = count.get(i, 0) + 1
        hash = {}
        for i in count.values():
            # 1:3 2:2 3:1
            if hash.get(i):
                # hash = {}             hash = {3:1}            hash = {3:1, 2:1}
                # hash.get(3) = None    hash.get(2) = None      hash.get(1) = None
                return False
                # hash[3] = 1           hash[2] = 1             hash[1] = 1
            hash[i] = 1
        return True     # 遍历完成,返回True

 

class Solution:
    def uniqueOccurrences(self, arr: List[int]) -> bool:
        count = {}
        # arr = [1,2]
        for i in arr:
            # count[1] = 1
            # count[2] = 1
            count[i] = count.get(i, 0) + 1
        hash = {}
        for i in count.values():
            # 1:1 2:1
            # hash = {}         hash = {1:1}
            if hash.get(i):   # hash.get(1) = True
                return False  # return False  
            # hash[1] = 1
            hash[i] = 1
        return True     # 遍历完成,返回True
解题代码
class Solution:
    def uniqueOccurrences(self, arr: List[int]) -> bool:
        count = {}
        for i in arr:   
            count[i] = count.get(i, 0) + 1        
        hash = {}
        for v in count.values():
            if hash.get(v):
                return False
            hash[v] = 1
        return True

<think>好的,用户想了解Python哈希表的用法,特别是如何使用字典来实现哈希表数据结构。我需要先回顾一下哈希表的基本概念和在Python中的具体实现方式。根据提供的引用内容,哈希表Python中是通过字典(dict)来实现的,字典提供了键值对的映射关系,具有快速查找的特点,时间复杂度接近O(1)。接下来,我需要整理用户可能关心的几个方面,比如字典的基本操作、如何处理键不存在的情况、哈希函数的作用以及性能优化等。 首先,字典的创建和初始化。用户可能想知道如何创建一个字典,添加键值对。引用中提到了使用花括号{}或者dict()构造函数,这部分需要详细说明,并给出示例代码。例如,my_dict = {"Kanye": "Come to life", "Drake": "Laugh Now Cry Later"}。 然后是常见的操作,比如访问元素、添加或修改元素、删除元素。根据引用[4],访问不存在的键会引发KeyError,所以需要提到get()方法或使用in关键字检查是否存在。这部分需要给出示例,比如my_dict.get("Drake", "默认值"),以及使用pop()和del删除元素。 接下来是遍历字典的方法,包括遍历键、值、键值对。这部分可以结合引用中的内容,说明使用keys()、values()、items()方法,并给出循环的示例代码。 哈希冲突的处理也是重要的一点,但引用中并没有详细说明Python内部如何处理冲突,可能需要简要提及开放寻址法或链表法,但根据Python的实际情况,可能采用的是开放寻址法。不过用户问题更关注使用方法,所以这部分可以简略带过。 另外,用户可能关心字典的特点,比如键的唯一性、不可变类型的键等。需要强调键必须是不可变类型,如字符串、数字、元组等,而值可以是任意类型。引用[3]提到每个对象都有哈希值,这帮助字典快速查找,这里可以引用相关内容。 性能方面,哈希表的查找、插入、删除都是平均O(1)的时间复杂度,但最坏情况下可能退化为O(n),但实际中很少发生。需要根据引用[3]和[5]的内容,说明字典的高效性。 最后,应用场景和注意事项。例如,字典适合缓存、计数、快速查找等场景。注意事项包括键的类型、处理键不存在的情况,避免在遍历时修改字典等。 在组织内容时,需要按照逻辑顺序,从创建到操作,再到高级用法和注意事项,逐步展开。同时,确保所有代码示例符合Python语法,并正确使用字典的方法。引用相关的地方要正确标注,比如哈希函数的实现、性能特点等,对应的引用编号要准确。 可能还需要检查是否有遗漏的点,比如字典推导式、嵌套字典的使用,或者与其他数据结构的比较,但根据用户的问题,重点在于基本使用方法和数据结构实现,所以这些高级内容可能不需要深入,除非用户的问题中提到。 现在需要将上述思考整理成一个结构清晰的中文回答,分步骤说明Python哈希表(字典)的使用方法,确保每个部分都有对应的代码示例和引用标注。同时,生成相关问题,帮助用户进一步学习。</think>### Python哈希表(字典)的使用方法 Python中的哈希表通过内置的**字典(dict)**实现,提供了高效的键值对存储和查找功能。以下是具体使用方法: --- #### 一、字典的创建与初始化 1. **直接定义** 使用花括号`{}`,键和值用冒号分隔,键值对之间用逗号分隔: ```python my_dict = {"Kanye": "Come to life", "Drake": "Laugh Now Cry Later"} ``` 2. **使用构造函数`dict()`** 适用于动态构建字典: ```python empty_dict = dict() user_info = dict(name="Alice", age=30) ``` --- #### 二、字典的常见操作 1. **访问元素** - 直接通过键访问:`my_dict["Kanye"]`,若键不存在会引发`KeyError`[^4]。 - 使用`get()`方法避免异常,可设置默认值: ```python print(my_dict.get("Drake", "默认值")) # 输出"Laugh Now Cry Later"或默认值[^4] ``` 2. **添加/修改元素** 通过赋值操作实现: ```python my_dict["Taylor"] = "All Too Well" # 添加新键值对 my_dict["Kanye"] = "Donda" # 修改现有键的值 ``` 3. **删除元素** - `pop(key)`:删除键并返回对应的值。 - `del`关键字:直接删除键值对。 ```python removed_value = my_dict.pop("Drake") del my_dict["Kanye"] ``` --- #### 三、遍历字典 1. **遍历所有键** ```python for key in my_dict.keys(): print(key) ``` 2. **遍历所有值** ```python for value in my_dict.values(): print(value) ``` 3. **遍历键值对** ```python for key, value in my_dict.items(): print(f"{key}: {value}") ``` --- #### 四、哈希表的底层原理 - **哈希函数**:Python将键转换为哈希值(整数),再通过取模运算映射到存储位置[^3]。 - **冲突处理**:Python内部采用开放寻址法解决哈希冲突[^3]。 - **性能特点**:查找、插入、删除操作的平均时间复杂度为$O(1)$,最坏情况(哈希冲突严重)退化为$O(n)$[^3][^5]。 --- #### 五、应用场景与注意事项 1. **适用场景** - 缓存系统(如`@lru_cache`装饰器) - 快速统计词频 - 数据库索引优化 2. **注意事项** - 键必须是不可变类型(如字符串、数字、元组),值可以是任意类型。 - 避免在遍历时修改字典结构。 - 使用`in`关键字检查键是否存在: ```python if "Kanye" in my_dict: print("键存在") ``` --- ### 相关问题 1. Python字典如何处理哈希冲突? 2. 如何实现字典的按值排序? 3. 字典与集合(set)在实现上有何异同? 4. 为什么字典的键必须是不可变类型? [^1]: 哈希表算法Python中可以使用字典(dict)数据结构来实现。 : 哈希表(hash table)也叫作散列表,这种数据结构提供了键(key)和值(value)的映射关系。 [^4]: Python 哈希表的实现——字典。可以看到,我们通过方括号[key]来访问键对应的值,如果键不存在,则会报错。 : 散列(哈希)是电脑科学中一种对资料的处理方法,通过某种特定的函数/算法将要检索的项与索引关联起来。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值