title:Bucket Sort
date:2023-10-05 21:24:49
tags:Computer science
桶排序(Bucket Sort)
桶排序也是线性时间的排序方法,下面介绍其原理以及代码展示。
原理
桶排序如其名,是将输入序列分配到不同“桶”中,再对分别对桶内的元素进行排序的操作。当然这只是一种感性的解释。
假如输入序列的n个元素均匀,独立地分布在序列[0,1)上,那么可以将[0,1)划分为n个相同大小的区间,即是"桶",由于这些元素均匀独立地分布在[0,1)上,所以不会有许多的元素在同一个区间上,之后对每一个区间上的元素排序,再将区间上元素依次列出,完成了排序。
假设我们有一个10元素序列均匀独立分布在[0,1)上,那么桶排序可以由下图表示:
在图中,我们建立了一个临时数组B[0…n-1]来存放链表,这个临时数组就是“桶”,每个“桶”内的元素再进行了排序。
如何将元素插入对的桶中呢?
假设要处理的元素为A[i],那么我们可以low(nA[i]),比如上面的.12 * 10 = 1.2 ,low(1.2) = 1,那么这个.12会被放进下标为1的桶中,由于low(.13 * 10) = 1,所以被放入同一个桶中。
那么对于两个元素A[i] <=A[j],low(nA[i]) <=low(nA[j]),如果A[i]和A[j]被放入同一个桶中,那么在桶内排序时,两个元素能成为正确的排序,如果A[i]和A[j]被放入了不同桶中,那么A[i]只会被放入下标更小的桶中,在最后根据桶的下标依次输出,两个元素也是正确的顺序,因此这个算法是正确的。
代码
public static void BucketSort(double[] a){
int n = a.length;
List<integer>[] b = new List[n];//表示一个泛型数组,其中每个元素都是一个 List 对象,该 List 对象中存储的元素类型为 Integer
for(int i = 0;i < n;i++){
b[i] = new Arraylist<>();
}
for(int i = 0; i < n; i++){
b[(int)(n*a[i])].add(a[i]);
}
for(int i = 0; i < n-1; i++){
b[i].sort();
}
System.out.println(b);
}
性能分析
我们可以注意到时间复杂度主要在分配元素和对桶内排序上,除了插入排序之外的时间复杂度可以用O(n)表示,关键在于插入排序的分析。
假设第i桶内的元素个数用n[i]表示,那么时间代价为:
∑
i
=
0
n
−
1
O
(
n
i
2
)
\sum_{i=0}^{n-1}O(n_i^2)
i=0∑n−1O(ni2)
那么总的时间代价可以表示为
T
(
n
)
=
Θ
(
n
)
+
∑
i
=
0
n
−
1
O
(
n
i
2
)
T(n) = \Theta(n) + \sum_{i=0}^{n-1}O(n_i^2)
T(n)=Θ(n)+i=0∑n−1O(ni2)
关于对时间代价的期望,《算法导论》已经给出了很详细的解释,这里由于无法给出更简洁更有趣的求取过程,便不再赘述。
最后求得桶排序的时间复杂度为:
Θ
(
n
)
\Theta(n)
Θ(n)
即使桶排序的元素不服从均匀分布,桶排序依然可以在线性时间完成,只要输入序列满足:
所有桶的大小的平方和总的元素呈现线性关系。
那么,桶排序可以在线性时间内完成。