OI Wiki插入排序与希尔排序：简单排序算法的优化之路-优快云博客

OI Wiki插入排序与希尔排序：简单排序算法的优化之路

【免费下载链接】OI-wiki :star2: Wiki of OI / ICPC for everyone. （某大型游戏线上攻略，内含炫酷算术魔法）项目地址: https://gitcode.com/GitHub_Trending/oi/OI-wiki

在算法竞赛(OI/ICPC)中，排序算法是处理数据的基础工具。当面对大量无序数据时，选择合适的排序方法直接影响程序效率。本文将从最基础的插入排序讲起，逐步揭示希尔排序如何通过巧妙的优化突破性能瓶颈，成为竞赛中实用的排序方案。

插入排序：直观高效的基础排序法

核心思想与工作原理

插入排序（Insertion Sort）是一种直观的排序算法，其核心思想是将待排序序列分为"已排序"和"未排序"两部分，每次从"未排序"区域选择一个元素插入到"已排序"区域的正确位置。这个过程类似于打扑克牌时，将新抓的牌按大小顺序插入到手牌中的操作。

算法实现与关键代码

插入排序的实现非常简洁，主要包含以下步骤：

从第二个元素开始遍历数组（假设第一个元素已排序）
保存当前元素作为"待插入值"
与已排序区域元素从后向前比较，找到插入位置
移动元素并插入待插入值

以下是C++实现代码：

void insertion_sort(int arr[], int len) {
  for (int i = 1; i < len; ++i) {
    int key = arr[i];
    int j = i - 1;
    while (j >= 0 && arr[j] > key) {
      arr[j + 1] = arr[j];
      j--;
    }
    arr[j + 1] = key;
  }
}

完整代码可参考：docs/basic/code/insertion-sort/insertion-sort_1.cpp

算法特性分析

稳定性：插入排序是稳定的排序算法，相等元素的相对位置不会改变。

时间复杂度：

最优情况：$O(n)$（数列已接近有序）
最坏情况：$O(n^2)$（数列完全逆序）
平均情况：$O(n^2)$

适用场景：小规模数据或接近有序的数据排序，在STL的stable_sort中当数据量较小时会使用插入排序。

插入排序的优化：折半插入排序

对于插入排序，可以使用二分查找优化插入位置的查找过程，这就是折半插入排序。虽然时间复杂度的数量级仍为$O(n^2)$，但减少了比较操作的次数，在数据量较大时能显著提升性能。

void insertion_sort(int arr[], int len) {
  if (len < 2) return;
  for (int i = 1; i != len; ++i) {
    int key = arr[i];
    auto index = upper_bound(arr, arr + i, key) - arr;
    // 使用 memmove 移动元素，比使用 for 循环速度更快
    memmove(arr + index + 1, arr + index, (i - index) * sizeof(int));
    arr[index] = key;
  }
}

希尔排序：突破O(n²)的优化之路

从插入排序到希尔排序的演进

插入排序在处理大规模数据时效率低下，主要原因是每次只能将元素移动一位。希尔排序（Shell Sort）通过引入"增量序列"（间隔序列），允许元素一次性移动多个位置，从而大幅减少比较和交换次数。

算法原理与过程

希尔排序的工作过程分为以下几步：

将待排序序列分为若干子序列（子序列元素之间的间距相同）
对每个子序列进行插入排序
逐渐减小间距，重复上述过程直至间距为1

希尔排序过程示意图

增量序列的选择

希尔排序的性能很大程度上取决于增量序列的选择，常见的增量序列有：

希尔增量：$h = \lfloor n/2 \rfloor, \lfloor n/4 \rfloor, ..., 1$
Hibbard增量：$h = 2^k - 1, 2^{k-1} - 1, ..., 1$（时间复杂度$O(n^{3/2})$）
Sedgewick增量：$h = 4^k + 3 \times 2^{k-1} + 1$（时间复杂度$O(n\log^2 n)$）

算法实现

以下是采用Hibbard增量的希尔排序实现：

template <typename T>
void shell_sort(T array[], int length) {
  int h = 1;
  while (h < length / 3) {
    h = 3 * h + 1;  // 生成初始增量
  }
  while (h >= 1) {
    // 对每个子序列进行插入排序
    for (int i = h; i < length; i++) {
      for (int j = i; j >= h && array[j] < array[j - h]; j -= h) {
        std::swap(array[j], array[j - h]);
      }
    }
    h = h / 3;  // 减小增量
  }
}

算法特性分析

稳定性：希尔排序是不稳定的排序算法，相等元素的相对位置可能改变。

时间复杂度：

最优情况：$O(n)$
最坏情况：取决于增量序列，通常为$O(n\log^2 n)$或$O(n^{3/2})$
平均情况：与增量序列有关，优于$O(n^2)$

空间复杂度：$O(1)$，只需要常数级的额外空间

两种排序算法的对比与应用

性能对比

算法	平均时间复杂度	最坏时间复杂度	空间复杂度	稳定性	适用场景
插入排序	$O(n^2)$	$O(n^2)$	$O(1)$	稳定	小规模数据、接近有序数据
希尔排序	$O(n\log^2 n)$	$O(n\log^2 n)$	$O(1)$	不稳定	中等规模数据、对空间敏感场景

实际应用建议

在算法竞赛中：
- 当n ≤ 100时，插入排序简洁高效
- 当100 < n ≤ 10000时，希尔排序是不错的选择
- 当n > 10000时，考虑使用快速排序或归并排序
代码实现技巧：
- 对接近有序的数据优先使用插入排序
- 实现希尔排序时注意增量序列的选择
- 小规模数据排序可直接使用STL的sort（内部会根据数据特征选择最优算法）

总结与拓展学习

插入排序和希尔排序展示了算法优化的典型思路：从简单直观的实现出发，通过深入分析性能瓶颈，引入创新思想突破原有复杂度限制。希尔排序通过引入增量序列，成功将时间复杂度从$O(n^2)$降至$O(n\log^2 n)$，这种"分而治之"的策略在许多高级算法中都有体现。

进一步学习资源

排序算法入门：docs/basic/sort-intro.md
更多排序算法实现：docs/basic/use-of-sort.md
算法竞赛中的排序应用：docs/contest/common-tricks.md

通过掌握这些基础排序算法的原理与实现，我们不仅能在竞赛中灵活运用，更能培养算法设计与优化的思维方式，为解决更复杂的问题打下基础。

【免费下载链接】OI-wiki :star2: Wiki of OI / ICPC for everyone. （某大型游戏线上攻略，内含炫酷算术魔法）项目地址: https://gitcode.com/GitHub_Trending/oi/OI-wiki

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考