多路归并 外排序 大文件排序 海量数据处理

本文介绍了一种针对大型文件的排序方法——多路归并外排序。该方法通过将大文件分批读入内存进行排序,再进行归并操作来实现整体排序,适用于文件大小超过内存容量的情况。

//多路归并外排序的实现
//将一个保存在磁盘上的文件内的数据进行排序
//基本思路是:设文件共有m*n条记录, 内存中每次可以对m条记录进行排序
//则排序过程分两步:
//第一步:从磁盘中读入m条记录到内存; 在内存排序; 将排好序的数据写入新文件; 
//         重复上述过程n次 共生成n个新文件

//第二步:分配一个文件指针数组 包含n个文件指针,分别指向n个新文件;
//   分配一个整数数组 大小为n 分别顺序读取各个文件的数据
//   分配一个布尔数组 大小为n 指示各个文件是否读完
//   将读入的整数数组中最小的值写入外存 并继续往后读取对应的文件 然后重复这一步 直到所有的文件都读完

这种算法思想常用于大文件排序,文件大小超出内存容量,可以每次读取内存容量的数据进行内存排序,然后进行归并

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值