package com.qirui.algorithm.sort;
/**
* @Description: 希尔排序
* 希尔排序是插入排序的一种更高效的改进版本,它是基于插入排序的以下两点性质而提出改进方法的:
* 1、插入排序在对几乎已经排序好的序列操作时,效率高,可以达到线性排序的效率。
* 2、插入排序一般来说是低效的,因为它每次只能移动一位。
*
* 希尔排序是将待排序的序列按指定步长分为若干个子序列,分别对子序列做插入排序,步长越来越小,直到步长为1,
* 最后以1步长对序列做插进入排序,此时,需排序的数据几乎已经排好了(此时插入排序较快)
*/
public class ShellSort {
private static void shellSort(int[] a) {
int h = 1;
while (h < a.length / 3) {
h = h*3 + 1; // <O(n^(3/2)) by Knuth,1973>: 1, 4, 13, 40, 121, ...
}
for(; h >= 1; h /= 3) { // 步长
for(int k = 0; k < h; k++) { // 遍历子序列
for(int i = h + k; i < a.length; i += h) { // 相邻序列
// 比较,如果当前位置的元素小于前面的同位置的元素,则交换
// 此处类似于插入排序
for(int j = i; j >= h && a[j] - a[j - h] < 0; j -= h) {
int tmp = a[j];
a[j] = a[j - h];
a[j - h] = tmp;
}
}
}
}
}
public static void main(String[] args) {
int[] a = {49, 38, 65, 97, 76, 13, 27, 49, 78, 34, 12, 64, 5, 4, 62, 99, 98, 54, 56, 17, 18, 23, 34, 15, 35, 25, 53, 51};
System.out.println("----------before sort----------");
for(int m = 0; m < a.length; m++) {
System.out.print(a[m] + ", ");
}
System.out.println();
shellSort(a);
System.out.println("----------after sort----------");
for(int m = 0; m < a.length; m++) {
System.out.print(a[m] + ", ");
}
}
}
一个更好理解的希尔排序实现:将数组列在一个表中并对列排序(用插入排序)。重复这过程,不过每次用更长的列来进行。最后整个表就只有一列了。将数组转换至表是为了更好地理解这算法,算法本身仅仅对原数组进行排序(通过增加索引的步长,例如是用i += step_size而不是i++)。
例如,假设有这样一组数[ 13 14 94 33 82 25 59 94 65 23 45 27 73 25 39 10 ],如果我们以步长为5开始进行排序,我们可以通过将这列表放在有5列的表中来更好地描述算法,这样他们就应该看起来是这样:
13 14 94 33 82 25 59 94 65 23 45 27 73 25 39 10
然后对每列进行排序:
10 14 73 25 23 13 27 94 33 39 25 59 94 65 82 45将上述四行数字,依序接在一起时我们得到:[ 10 14 73 25 23 13 27 94 33 39 25 59 94 65 82 45 ].这时10已经移至正确位置了,然后再以3为步长进行排序:
10 14 73 25 23 13 27 94 33 39 25 59 94 65 82 45排序之后变为:
10 14 13 25 23 33 27 25 59 39 65 73 45 94 82 94最后以1步长进行排序(此时就是简单的插入排序了)。
步长
步长的选择是希尔排序的重要部分。只要最终步长为1任何步长串行都可以工作。算法最开始以一定的步长进行排序。然后会继续以一定步长进行排序,最终算法以步长为1进行排序。当步长为1时,算法变为插入排序,这就保证了数据一定会被排序。
Donald Shell 最初建议步长选择为并且对步长取半直到步长达到 1。虽然这样取可以比
类的算法(插入排序)更好,但这样仍然有减少平均时间和最差时间的余地。 可能希尔排序最重要的地方在于当用较小步长排序后,以前用的较大步长仍然是有序的。比如,如果一个数列以步长5进行了排序然后再以步长3进行排序,那么该数列不仅是以步长3有序,而且是以步长5有序。如果不是这样,那么算法在迭代过程中会打乱以前的顺序,那就不会以如此短的时间完成排序了。
步长串行 | 最坏情况下复杂度 |
---|---|
![]() | ![]() ![]() |
![]() | ![]() ![]() |
![]() | ![]() ![]() |
已知的最好步长串行是由Sedgewick提出的 (1, 5, 19, 41, 109,...),该串行的项来自 9 * 4^i - 9 * 2^i + 1 和 4^i - 3 * 2^i + 1 这两个算式.这项研究也表明“比较在希尔排序中是最主要的操作,而不是交换。”用这样步长串行的希尔排序比插入排序和堆排序都要快,甚至在小数组中比快速排序还快,但是在涉及大量数据时希尔排序还是比快速排序慢。
另一个在大数组中表现优异的步长串行是(斐波那契数列除去0和1将剩余的数以黄金分区比的两倍的幂进行运算得到的数列):(1, 9, 34, 182, 836, 4025, 19001, 90358, 428481, 2034035, 9651787, 45806244, 217378076, 1031612713, …)