好的,我们来详细讲解一下插入排序。
插入排序是一种简单直观的排序算法,它的工作原理非常类似于我们整理手中的扑克牌。
核心思想
将待排序的序列(数组)看作两部分:
- 已排序序列:默认第一个元素自身就是有序的。
- 未排序序列:第一个元素之后的所有元素。
排序过程中,逐个地将未排序序列中的元素插入到已排序序列中的正确位置,直到所有元素都插入完毕。
算法步骤
- 开始:从数组的第二个元素开始(索引为1,因为第一个元素默认已排序),将其视为“待插入元素”。
- 比较与移动:
· 将“待插入元素”与它前面的已排序序列中的元素从后往前依次比较。
· 如果前面的元素比“待插入元素”大,则将该元素向后移动一位,为“待插入元素”腾出空间。
· 继续向前比较,直到找到一个比“待插入元素”小或相等的元素,或者已经比较到数组的开头。 - 插入:将“待插入元素”插入到找到的正确位置(即最后一个被移动的元素的原位置)。
- 重复:对下一个未排序元素(即索引为2, 3, …的元素)重复步骤2和3,直到整个数组排序完成。
图解示例
假设我们要对数组 [5, 2, 4, 6, 1, 3] 进行升序排序。
· 初始状态:[5, 2, 4, 6, 1, 3]
· 5 是初始的已排序序列。
· 2, 4, 6, 1, 3 是未排序序列。
- 第一轮 (i=1):处理元素 2
· 比较:2 < 5,将 5 向后移动 → [5, 5, 4, 6, 1, 3]
· 到达头部,插入 2 → [2, 5, 4, 6, 1, 3] - 第二轮 (i=2):处理元素 4
· 比较:4 < 5,将 5 向后移动 → [2, 5, 5, 6, 1, 3]
· 比较:4 > 2,在 2 后面插入 4 → [2, 4, 5, 6, 1, 3] - 第三轮 (i=3):处理元素 6
· 比较:6 > 5,无需移动,直接插入当前位置 → [2, 4, 5, 6, 1, 3] - 第四轮 (i=4):处理元素 1
· 比较:1 < 6,移动 6 → [2, 4, 5, 6, 6, 3]
· 比较:1 < 5,移动 5 → [2, 4, 5, 5, 6, 3]
· 比较:1 < 4,移动 4 → [2, 4, 4, 5, 6, 3]
· 比较:1 < 2,移动 2 → [2, 2, 4, 5, 6, 3]
· 到达头部,插入 1 → [1, 2, 4, 5, 6, 3] - 第五轮 (i=5):处理元素 3
· 比较:3 < 6,移动 6 → [1, 2, 4, 5, 6, 6]
· 比较:3 < 5,移动 5 → [1, 2, 4, 5, 5, 6]
· 比较:3 < 4,移动 4 → [1, 2, 4, 4, 5, 6]
· 比较:3 > 2,在 2 后面插入 3 → [1, 2, 3, 4, 5, 6]
排序完成!
代码实现(Python)
def insertion_sort(arr):
"""
对数组进行插入排序 (升序)
"""
# 遍历从1到n-1,因为第一个元素默认已排序
for i in range(1, len(arr)):
key = arr[i] # 当前待插入的元素
j = i - 1 # 从i的前一个位置开始比较
# 将比key大的元素都向后移动一位
while j >= 0 and key < arr[j]:
arr[j + 1] = arr[j]
j -= 1
# 将key插入到找到的正确位置
arr[j + 1] = key
# 测试代码
if __name__ == "__main__":
my_list = [5, 2, 4, 6, 1, 3]
print("原始数组:", my_list)
insertion_sort(my_list)
print("排序后数组:", my_list)
输出:
原始数组: [5, 2, 4, 6, 1, 3]
排序后数组: [1, 2, 3, 4, 5, 6]
算法分析
· 时间复杂度:
· 最坏情况:数组完全逆序。每个新元素都需要比较并移动到最前面。需要进行 1 + 2 + 3 + … + (n-1) = n(n-1)/2 次比较和移动,即 O(n²)。
· 最好情况:数组已经有序。每个新元素只需要比较一次。需要进行 (n-1) 次比较,0次移动,即 O(n)。
· 平均情况:O(n²)。
· 空间复杂度:O(1)。因为它是一种原地排序算法,只使用了常数级别的额外空间(用于存储 key 和索引)。
· 稳定性:稳定。在比较时,如果遇到相等的元素,插入排序会将新元素放在相等元素的后面,不会改变它们的相对顺序。
优缺点
优点:
· 实现简单,代码易于理解和编写。
· 对于小规模数据或基本有序的数据,效率很高。
· 是稳定的排序算法。
· 是原地排序算法,空间效率高。
· 在线算法:可以逐个接收数据并进行排序,适用于数据流。
缺点:
· 对于大规模乱序数据,效率较低,时间复杂度为 O(n²)。
总结
插入排序是一种基础且重要的排序算法。虽然它在处理大数据时不如快速排序、归并排序等高效算法,但由于其实现简单、对小数据集和近乎有序的数据集效率很高,它在实际中仍有广泛应用,例如作为快速排序等复杂算法在小规模数据上的优化子过程。理解插入排序是学习更高级排序算法的重要基础。
5572

被折叠的 条评论
为什么被折叠?



