一、介绍
「插入排序insertionsort」是一种简单的排序算法,它的工作原理与手动整理一副牌的过程非常相似。 具体来说,我们在未排序区间选择一个基准元素,将该元素与其左侧已排序区间的元素逐一比较大小,并将该元素插入到正确的位置。
下图展示了数组插入元素的操作流程。设基准元素为 base ,我们需要将从目标索引到base 之间的所有元素向右移动一位,然后再将 base 赋值给目标索引。
二、算法流程
插入排序的整体流程如下图所示。
1. 初始状态下,数组的第1个元素已完成排序。
2. 选取数组的第2个元素作为 base ,将其插入到正确位置后,数组的前2个元素已排序。
3. 选取第3个元素作为 base ,将其插入到正确位置后,数组的前3个元素已排序。
4. 以此类推,在最后一轮中,选取最后一个元素作为 base ,将其插入到正确位置后,所有元素均已排序。
三、代码
def insertion_sort(nums: list[int]):
""" 插入排序"""
# 外循环:已排序区间为 [0, i-1]
for i in range(1, len(nums)):
base = nums[i]
j = i- 1
# 内循环:将 base 插入到已排序区间 [0, i-1] 中的正确位置
while j >= 0 and nums[j] > base:
nums[j + 1] = nums[j] # 将 nums[j] 向右移动一位
j -= 1
nums[j + 1] = base # 将 base 赋值到正确位置
nums = [1, 3, 5, 7, 9, 2, 4, 6, 8, 0]
insertion_sort(nums)
print(nums)
四、算法特性
‧ 时间复杂度𝑂(𝑛2)、自适应排序:最差情况下,每次插入操作分别需要循环𝑛−1、𝑛−2、…、2、1 次,求和得到(𝑛−1)𝑛/2,因此时间复杂度为𝑂(𝑛2)。在遇到有序数据时,插入操作会提前终止。 当输入数组完全有序时,插入排序达到最佳时间复杂度𝑂(𝑛)。
‧ 空间复杂度𝑂(1)、原地排序:指针𝑖和𝑗使用常数大小的额外空间。
‧ 稳定排序:在插入操作过程中,将元素插入到相等元素的右侧,不会改变它们的顺序。
五、插入排序优势
插入排序的时间复杂度为𝑂(),而后篇将学习的快速排序的时间复杂度为𝑂(𝑛log𝑛)。尽管插入排序的时间复杂度相比快速排序更高,但在数据量较小的情况下,插入排序通常更快。 这个结论与线性查找和二分查找的适用情况的结论类似。
快速排序这类𝑂(𝑛log𝑛)的算法属于基于分治的 排序算法,往往包含更多单元计算操作。而在数据量较小时,𝑛2和𝑛log𝑛的数值比较接近,复杂度不占主导作用;每轮中的单元操作数量起到决定性因素。
实际上,许多编程语言(例如Java)的内置排序函数都采用了插入排序,大致思路为:对于长数组,采用基于分治的排序算法,例如快速排序;对于短数组,直接使用插入排序。 虽然冒泡排序、选择排序和插入排序的时间复杂度都为𝑂(),但在实际情况中,插入排序的使用频率显著高于冒泡排序和选择排序,主要有以下原因:
‧ 冒泡排序基于元素交换实现,需要借助一个临时变量,共涉及3个单元操作;插入排序基于元素赋值实现,仅需1个单元操作。因此,冒泡排序的计算开销通常比插入排序更高。
‧ 选择排序在任何情况下的时间复杂度都为𝑂(
)。如果给定一组部分有序的数据,插入排序通常比选择排序效率更高。
‧ 选择排序不稳定,无法应用于多级排序。