分布式系统中的计数、排序与协调
1. 并行排序概述
排序是一项极为重要的计算任务,其历史可以追溯到19世纪Hollerith的排序机,历经20世纪40年代的第一代电子计算机系统,发展至今,绝大多数程序都会以某种形式运用到排序。排序算法的选择很大程度上取决于待排序项的数量、键的数值特性,以及这些项是存储在内存中还是外部存储设备里。并行排序算法也可以按照同样的方式进行分类。
主要介绍两类排序算法:
- 排序网络 :通常适用于内存中的小数据集。
- 样本排序算法 :适用于外部内存中的大数据集。
2. 排序网络
2.1 比较器与比较网络
排序网络是由比较器构成的网络,这与计数网络由平衡器构成类似。比较器是一种具有两个输入线和两个输出线(分别称为顶线和底线)的计算元件。它接收两个输入线上的数字,将较大的数字转发到顶线,较小的数字转发到底线。与平衡器不同,比较器是同步的,只有当两个输入都到达时才会输出值。
比较网络是一个无环的比较器网络。每个输入值被放置在其w条输入线上,这些值同步地通过每一层比较器,最终一起从网络输出线输出。如果一个比较网络的输出值是其输入值按降序排列的结果,即$y_{i - 1} \geq y_i$,那么它就是一个有效的排序网络。
2.2 0 - 1原则
定理:如果一个排序网络能对所有由0和1组成的输入序列进行排序,那么它就能对任何输入值序列进行排序。
2.3 设计排序网络
无需专门设计排序网络,因为可以复用计数网络的布局。
超级会员免费看
订阅专栏 解锁全文
798

被折叠的 条评论
为什么被折叠?



