第二章：数据结构-heapq:堆排序算法-高效合并有序序列

最新推荐文章于 2023-12-06 19:23:19 发布

转载最新推荐文章于 2023-12-06 19:23:19 发布 · 239 阅读

Python标准库专栏收录该内容

819 篇文章

订阅专栏

本文介绍了一种高效合并多个有序序列的方法，使用heapq.merge()替代直接排序，适用于大数据集，通过堆实现，节省内存并提高效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

2.4.5 高效合并有序序列
对于小数据集，将多个有序序列合并到一个新序列很容易。list(sorted(itertools.chain(*data)))对于较大的数据集，这个技术可能会占用大量内存。merge()不是对整个合并后的序列排序，而是使用一个堆一次一个元素地生成一个新序列，利用固定大小的内存确定下一个元素。

import heapq
import random

random.seed(2016)

data = []
for i in range(4):
    new_data = list(random.sample(range(1,101),5))
    new_data.sort()
    data.append(new_data)

for i,d in enumerate(data):
    print('{}:{}'.format(i,d))

print('\nMerged:')
for i in heapq.merge(*data):
    print(i,end=' ')
print()