希尔排序(Shell‘s Sort)其实是一种优化的插入排序,插入排序(insertSort)平均时间复杂度为O(n^2),仅仅比较时间复杂度的话,优于插入排序的还有很多其它排序方法,比如说堆排序或者归并排序。很奇怪为啥现在算法里还介绍插入排序,考虑到它时间复杂度这么大,但书上也说了,如果数据量小的话,插入排序效率还是蛮高的。我觉得最重要一点是插入排序简单,几乎不需要思考就可以写出来。
插入排序的平均时间复杂度为O(n^2),如果数据是正序(已经排好序)的话,可以为O(n)。可以看到越是排好序的数据集,插入排序效率越高,希尔排序相较于插入排序优化的地方正在于此。它通过对原始数据集进行多次划分子数据集,然后对子数据集进行插入排序,多次操作后,原始数据集逐渐变成有序的数据集,最后再来一次插入排序就行了。举个例子:
数据集集合如下,共9个元素
9,3,4,7,5,2,10,8,16
希尔排序通过增量对数据集划分,这里假设增量数组为5,3,1
第一次划分得到{a0, a5}, {a1,a6},{a2, a7},{a3,a8}, {a4},对这五个子数据集进行插入排序得到如下:
2,3,4,7,5,9,10,8,16
第二次增量是3,划分得到数据集为{a0, a3, a6}, {a1, a4, a7}, {a2, a5, a8},然后分别进行插入排序得到:
2,3,4,7,5,9,10,8,16
第三次增量是1,希尔排序最后的增量必须是1,相当于对整个数据集进行插入排序。这个时候我们可以看到,通过前两次希尔排序得到的数据集基本已经有序,这时候再进行插入排序的话,相较于原始排序效率提高了不少。
这里给出的增量数据集是随便给的,目前还没有较好的方法明确的定义增量数据集。采用较多的增量有下面这个公式,也可以使用其它的公式,需要注意的是,最后一个增量必须是1:
...9, 5, 3, 2, 1 dlta[k] = 2^(t-k) + 1; 0 <= k <= t <= log(n-1)
其中t为排序趟数。
下面是简单的c语言希尔排序实现。
void shellSort(int *arr, int numsSize, int *d, int size)
{
int i, k, v, j, m, n = 0;
while (n < size)
{
//遍历增量
k = d[n++];
//对增量子数组排序
for (i = 0; i < k; i++)
{
//指向增量子数组第二个元素
for (j = i + k; j < numsSize; j = j + k)
{
if (arr[j] < arr[j-k])
{
v = arr[j];
//在i, i+k,..,j之间找到合适位置并插入
m = j - k;
while(m >= 0 && arr[m] > arr[j]){
arr[m + k] = arr[m];
m -= k;
}
arr[m + k] = v;
}
}
}
}
}
=============================================================================================
Linux应用程序、内核、驱动、后台开发交流讨论群(745510310),感兴趣的同学可以加群讨论、交流、资料查找等,前进的道路上,你不是一个人奥^_^。


被折叠的 条评论
为什么被折叠?



