数据结构-外部排序-(多路归并排序、败者树、置换选择排序、最佳归并树)

文章介绍了外部归并排序的过程,包括16个块的排序和两两归并的时间分析。败者树用于减少比较次数,提高效率。置换选择排序通过动态选取最小元素优化了构建初始归并段。最佳归并树的概念中提到了哈夫曼树的应用,强调了n路归并时需要注意的情况。

目录

一、外部归并排序

 二、败者树

 三、置换选择排序

四、最佳归并树


一、外部归并排序

 16个块,先每个块读入内存进行排序在输出回来,进行16次读和16次写

 两两归并,第一趟如下

 在两两归并

 时间分析

 外部排序时间开销=读写外存时间+内存排序时间+内部归并时间

对r个初始归并段,做k路归并,则归并树可用k叉树表示,若树高为h,则归并趟树

 推到:k叉树第h层多有个结点,则满足       

初始归并段数量=文件总共记录/内存可容纳记录  r=n/l

加快速度方法

k增加(缓冲区个数增加):多路平衡归并,问题会每次比较大小次数太多

r减小(缓冲区大小增加) :构建更长初始归并段

 二、败者树

k增加,减少每次比对次数

 

 有了败着树,选出最小元素,只对比灰色每层就行,比对次   =h-1   

 三、置换选择排序

r减少,构造更长初始归并段

 按增序,开始读取3个记录,最小的(4)置换出去,并MINXMAX=4,,读取下一个,在获取最小的值是否小于MINXMAX,小于放入归并段1后面,

 如果大于定死这个(下次都不看),就获取下一个最小的值并大于MINXMAX的(14)置换出去后面,并更新MINXMAX14,然后继续置换,

直到3个位置的比 MINXMAX小,就重新一个归并段,在继续前面的置换流程一直结束 

四、最佳归并树

哈夫曼树构建

n路归并注意最后不满n路

 

 

 

### 外部排序的时间复杂度 对于外部排序而言,由于涉及磁盘I/O操作,整体效率不仅取决于算法本身的时间复杂度,还受到读写速度的影响。通常情况下,当数据量超出内存容量时,会采用多趟处理的方式进行排序。每趟处理过程中,程序将部分数据加载到内存完成内部排序后再写出至临时文件;最终再对这些临时文件执行k路归并得到完全有序的结果集[^3]。 具体来说,在理想状况下(假设每次都能充分利用缓冲区),外部排序的整体时间复杂度大约为 O(nlog_kn),其中 k 表示可同时参与归并的文件数目,而 n 则代表待排序记录总数。这里需要注意的是,实际应用中的性能还会因硬件条件差异有所波动。 ### 归并排序的时间复杂度 归并排序遵循分治原则,即递归地将列表分割成更小子序列直到每个子序列仅含单个元素,之后逐步两两合并已排序的小序列形成更大规模的有序集合。这一过程确保了即使面对逆序排列的数据也能保持稳定的线性对数级运行效率。 归并排序最佳、最差以及平均情况下的时间复杂度均为 O(n log n) 。这是因为无论输入如何分布,都需要经历相同次数的划分与合并动作才能使整个数组变得有序[^4]。 ```python def merge_sort(arr): if len(arr) <= 1: return arr mid = len(arr) // 2 left_half = merge_sort(arr[:mid]) right_half = merge_sort(arr[mid:]) return merge(left_half, right_half) def merge(left, right): sorted_list = [] i = j = 0 while i < len(left) and j < len(right): if left[i] < right[j]: sorted_list.append(left[i]) i += 1 else: sorted_list.append(right[j]) j += 1 sorted_list.extend(left[i:]) sorted_list.extend(right[j:]) return sorted_list ```
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值