1. 排序算法的类型
-
内部排序:数据都在内存中。
-
外部排序:数据太多,无法全部放入内存。
2. 外存和内存数据交换原理
操作系统以“块”为单位对磁盘存储空间进行管理,每块磁盘存储不同数据;磁盘的读/写以“块”为单位,数据读入内存后才能被修改,修改完了再写回磁盘。
3. 外部排序算法有哪些?
- 多路归并
- 多路平衡归并
- 败者树
- 置换-选择排序
- 最佳归并树
4. 多路归并
算法思路:使用多路归并算法,在内存中划分k个输入缓冲区和1个输出缓存区,每次从外存中读入k个段,对k个段进行归并,最终经过s 轮归并后只剩一个段,即完成整个外部排序。步骤如下:
① 生成r个初始归并段(对L个记录进行内部排序,组成一个有序的初始归并树。
② 进行s趟k路归并,s=[logk®]
5. 多路平衡归并
定义:
① 最多只能有k个段归并为一个;
② 每一趟归并中,若m个归并段参与归并,经过这一趟处理得到[m/k]个新的归并段。