希尔排序（Shell Sort）

原创已于 2022-08-08 18:47:37 修改 · 2k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#排序算法 #算法 #数据结构

于 2022-08-08 12:54:18 首次发布

排序算法专栏收录该内容

16 篇文章

订阅专栏

希尔排序是一种改进的插入排序，通过设置不同的增量序列提高效率。文章介绍了希尔排序的基本思想、实现步骤、时间复杂度和空间复杂度，并提供了多种增量序列（Donald、Knuth、Hibbard、Sedgewick）的实现代码。希尔排序是非稳定排序，适用于大型且部分有序的数据集，平均时间复杂度为O(n(log²n))。

希尔排序（Shell Sort）

一、基本思想

希尔排序是插入排序的一种，也称缩小增量排序，是直接插入排序算法的一种更高效的改进版本。希尔排序是非稳定的排序算法，是记录按下标的一定增量分组，对每组使用直接插入排序算法排序；随着增量逐渐减少，每组包含的关键字越来越多，当增量减至1时，整个文件恰被分成一组。插入排序在对几乎已经排好序的数据操作时，效率高，即可以达到线性排序的效率。

二、实现步骤

在插入排序中提高效率，通过增大移动的步幅来提高效率。在插入排序中，每次增大移动一大步从而快速将元素移动到其应该所在大致位置。

算法步骤：

将整个有 $n$ 个元素的数组序列分割成 $g a p (g a p = n /2)$ 个子序列，第 $1$ 个数据和第 $n /2 + 1$ 个数据分为一组；
一次循环中，在每个子序列中分别采用直接插入排序；
然后缩小间隔 $g a p$ ，即 $g a p = g a p /2$ ，然后变为 $n / g a p$ 个子序列，重复上述的子序列划分和排序工作；
不断重复上述过程，随着序列减少最后变为一个，即完成了整个排序

三、时间复杂度的分析

由于不断折半步长，时间复杂度从三层循环中产生，故平均、最坏时间复杂度为： $Θ(n(log⁡2(n))2)\Theta(n(\log_2(n))^2)$ 、 $O(n(\log_2(n))^2)$ 。当最后一层循环恰好不需要进行元素交换，即各分组恰好符合排序要求，则最好时间复杂度为： $Ω(nlog⁡2(n))\Omega(n \log_2(n))$ 。

四、空间复杂度的分析

就Donald提出的希尔排序算法而言，由于不额外开辟空间存储记录，空间复杂度是： $O (1)$ 。

五、算法实现

Donald Shell

def shell_sort(array: list, reverse: bool=False) -> None:
    '''
    array: 支持数值型数据，如整型与浮点型混合；支持全为字符串类型的数据；不支持字符串型与数值型混合。
    reverse: 是否降序, 默认采用升序。
    '''
    length = len(array)
    gap = length // 2 # set gap
    while gap >= 1:
        for index in range(gap, length):
            next = index
            while next >= gap and (array[next - gap] < array[next] if reverse else array[next - gap] > array[next]): # insertion sort
                array[next], array[next - gap] = array[next - gap], array[next]
                next -= gap
        gap //= 2 # renew

Knuth增量序列

def shell_sort(array: list, reverse: bool=False) -> None:
    '''
    array: 支持数值型数据，如整型与浮点型混合；支持全为字符串类型的数据；不支持字符串型与数值型混合。
    reverse: 是否降序, 默认采用升序。
    '''
    length = len(array)
    gap = 1
    while gap < length / 3:
        gap = int(3 * gap + 1)
    while gap >= 1:
        for index in range(gap, length):
            next = index
            while next >= gap and (array[next - gap] < array[next] if reverse else array[next - gap] > array[next]):
                array[next], array[next - gap] = array[next - gap], array[next]
                next -= gap
        gap = int(gap / 3)

Hibbard增量序列

Hibbard增量序列的取法为： $D_k=2^k-1$ 。

def shell_sort(array: list, reverse: bool=False) -> None:
    '''
    array: 支持数值型数据，如整型与浮点型混合；支持全为字符串类型的数据；不支持字符串型与数值型混合。
    reverse: 是否降序, 默认采用升序。
    '''
    length, index, sequence = len(array), 1, []
    value = (1 << index) - 1
    while value <= length:
        sequence.append(value)
        index += 1
        value = (1 << index) - 1
    for gap in reversed(sequence):
        for index in range(gap, length):
            next = index
            while next >= gap and (array[next - gap] < array[next] if reverse else array[next - gap] > array[next]):
                array[next], array[next - gap] = array[next - gap], array[next]
                next -= gap

Sedgewick增量序列

Sedgewick增量序列的取法为： $Dk=9⋅4i−9⋅2i+1D_k=9 \cdot 4^i-9 \cdot 2^i + 1$ 或 $4i−3⋅2i+14^i - 3 \cdot 2^i + 1$ 。

def shell_sort(array: list, reverse: bool=False) -> None:
    '''
    array: 支持数值型数据，如整型与浮点型混合；支持全为字符串类型的数据；不支持字符串型与数值型混合。
    reverse: 是否降序, 默认采用升序。
    '''
    length, index, sequence = len(array), 0, []
    pre, nex = 9 * ((1 << 2 * index) - (1 << index)) + 1, (1 << 2 * index + 4) - 3 * (1 << index + 2) + 1
    while pre <= length or nex <= length:
        sequence.append(pre)
        sequence.append(nex)
        index += 1
        pre, nex = 9 * ((1 << 2 * index) - (1 << index)) + 1, (1 << 2 * index + 4) - 3 * (1 << index + 2) + 1
    for gap in reversed(sequence):
        for index in range(gap, length):
            next = index
            while next >= gap and (array[next - gap] < array[next] if reverse else array[next - gap] > array[next]):
                array[next], array[next - gap] = array[next - gap], array[next]
                next -= gap