Python之heapq模块

本文详细介绍了Python标准库中的heapq模块,包括其提供的堆队列算法实现,如heappush、heappop等方法的功能与使用示例,以及heapq在处理大量数据时的高效性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1 heapq

该模块提供堆队列算法实现,即队列优先算法。堆是二项树,树中的父节点的值小于等于其子节点值,该算法使用数组 h e a p [ k ] &lt; = h e a p [ 2 ∗ k + 1 ] heap[k]&lt;=heap[2*k+1] heap[k]<=heap[2k+1] h e a p [ k ] &lt; = h e a p [ 2 ∗ k + 2 ] heap[k]&lt;=heap[2*k+2] heap[k]<=heap[2k+2]表示所有的k,从0开始计数,为了进行比较,不存在的元素记为无穷大,堆的一个有趣的属性是她的最小元素总是根元素 h e a p [ 0 ] heap[0] heap[0]

2 方法

2.1 heappush(heap, item)

功能:将item的值推送到heap中,保持堆不变。

  • Demo
import heapq
h = [1, 4, 56, 2, 5]
result = []
for value in h:
    heapq.heappush(result, value)
print("result form heap push: {}".format(result))
  • Result
result form heap push: [1, 4, 56, 2, 5]

2.2 heappop(heap)

功能:从heap中取值并返回最小的值,保持堆不变,若heap为空,报IndexError警告,使用 h e a p [ 0 ] heap[0] heap[0]即可获取最小的值,而不用pop。

  • Demo
import heapq
h = [1, 4, 56, 2, 5]
result = []
for value in h:
    heapq.heappush(result, value)
print("result form heap push: {}".format(result))
pop_result = [heapq.heappop(result) for i in range(len(result))]
print("result from pop: {}".format(pop_result))
  • Result
result form heap push: [1, 2, 56, 4, 5]
result from pop: [1, 2, 4, 5, 56]

2.3 heappushpop(heap, item)

功能:将item推送到heap,然后取出,并返回最小的值。

  • Demo
import heapq
h = [1, 4, 56, 2, 5, 6]
# 取出h中的第一个值
# 保持heap尺寸不变,将3推进heap
combine_result = heapq.heappushpop(h, 3) 
print("result form heap push: {}".format(combine_result))
print("new heap: {}".format(h))
  • Result
result form heap push: 1
new heap: [4, 2, 56, 3, 5, 6]

2.4 heapify(x)

功能:将列表x以线性时间方式转为堆。

  • Demo
import heapq
a = [1, 4, 5, 0]
heapq.heapify(a)
print("heapify result: {}".format(a))
  • Result
heapify result: [0, 1, 5, 4]

2.5 heapreplace(heap, item)

功能:从heap中取出并返回第一个值,将item推入heap,保持堆尺寸,若heap为空,报IndexError警告。

  • Demo
import heapq
a = [12, 33, 5, 10]
c = heapq.heapreplace(a, 2)
print("heap replace result: {}".format(c))
print("result: {}".format(a))
  • Result
heap replace result: 12
result: [2, 33, 5, 10]

2.6 merge(*iterables)

功能:多个输入合并为单个输出,返回排序的结果。

  • Demo
import heapq
a = [1, 33, 5, 10]
b = [3, 6, 7, 0, -1]
c = list(heapq.merge(b, a))
print("merge result: {}".format(c))
  • Result
merge result: [1, 3, 6, 7, 0, -1, 33, 5, 10]

2.7 nlargest(n, iterable[,key])

功能:从可遍历的数据集中返回n个最大的元素组成的列表。

  • Demo
import heapq
a = [1, 3, 4, 5, 6]
larger = heapq.nlargest(2, a)
print("largest two number: {}".format(larger))
  • Result
largest two number: [6, 5]

2.8 nsmallest(n, iterable[,key])

功能:从可遍历的数据集中返回n个最小的元素组成的列表。

  • Demo
import heapq
a = [1, 3, 4, 5, 6]
smaller = heapq.nsmallest(2, a)
print("smallest two number: {}".format(smaller))
  • Result
smallest two number: [1, 3]

[参考文献]
[1]https://docs.python.org/2/library/heapq.html


### Python 中 `heapq` 模块的使用方法 #### 创建和初始化堆 为了创建一个最小堆,可以先定义一个空列表来表示这个堆。接着利用 `heappush()` 函数向其中添加元素。 ```python import heapq # 初始化一个空堆 min_heap = [] # 向堆中加入数值 heapq.heappush(min_heap, 5) heapq.heappush(min_heap, 3) heapq.heappush(min_heap, 7) heapq.heappush(min_heap, 1) print(f'当前堆的内容为 {min_heap}') # 堆内部结构可能不是完全有序排列,但始终满足根节点是最小值的要求[^3] ``` #### 获取堆顶元素(即最小/大元素) 当需要获取堆内的极值时,可调用 `heappop()`, 这会弹出并返回该堆里的最小项;如果希望仅查看而不移除,则可以用 `nsmallest(1,...)` 或者直接访问第一个索引位置 `[0]`. ```python # 取得并移除最小元素 minimum_value = heapq.heappop(min_heap) print(f'取出的最小值是 {minimum_value}') # 查看新的堆首部元素 if min_heap: next_min_element = min_heap[0] print(f'下一个最小值将是 {next_min_element}') else: print('堆已为空') ``` #### 列表转成堆 对于已经存在的列表数据想要迅速构建成堆的形式,可以通过内置函数 `heapify()` 实现这一目的。这一步骤的时间复杂度接近线性时间 O(n),效率很高。 ```python existing_list = [9, 8, 7, 6, 5, 4, 3, 2, 1] # 把现有列表转换成堆形式 heapq.heapify(existing_list) print(f'经过 heapify 处理后的列表变为 {existing_list} ') ``` #### 找到最大的 N 个项目或者最小的 N 个项目 除了基本功能外,`heapq` 提供了两个特别有用的方法——`nlargest()` 和 `nsmallest()` ,用于快速检索指定数量的最大或最小条目。 ```python sample_data = [random.randint(-100, 100) for _ in range(20)] top_three_largest = heapq.nlargest(3, sample_data) bottom_four_smallest = heapq.nsmallest(4, sample_data) print(f'{len(sample_data)}个随机整数里前三大的分别是{top_three_largest}') print(f'{len(sample_data)}个随机整数里最四小的是{bottom_four_smallest}') ``` 通过这些例子可以看出,在面对涉及大量动态变化的数据集以及频繁查询极端值的应用场景下,采用基于二叉树性质构建起来的小顶堆或是大顶堆能够显著提高算法性能[^2].
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值