排序算法剖析-优快云博客

本文链接：https://blog.youkuaiyun.com/zhangrunnanshuai/article/details/77862813

2.1插入排序

是对少量元素有效的排序算法。（效率上）
排序原理，类似于打牌时在手上拿牌，把牌放到正确的位置1。
参数：需要排序的数组。
原地（原址）算法，在算法执行过程中，只使用常数个存储空间（和问题规模不相关）。
在算法结束时，输入数组包含排序好的输出序列。
Python代码：

#flag代表那升序还是降序排序，true代表升序
def InsertionSort(l, flag=True):
    for i in range(1, len(l)):
        key = l[i]
        for j in range(i - 1, -1, -1):
            if l[j] > key:
                l[j + 1] = l[j]
            else:
                break
        l[j + 1] = key
    if not flag:
        l.reverse()

循环不变式以及插入排序正确性

详见算法导论P10。
这里对循环不变式做一个说明和总结：
循环不变式是一个“性质”，其在算法的初始化、保持和终止阶段都可被证明为真或为假。由此证明算法正确性。
在初始化和保持阶段，循环不变式的证明类似于数学归纳法，在终止阶段，终止这种归纳，联合终止条件，证明算法正确性。
实际上，循环不变式就是说，在算法中存在这么一个性质，其从算法的开始保持到终止，若其一直保持，结合终止条件，则可得到结论，算法达成其目标。
针对插排的证明见算法导论P11。
伪代码约定：算法导论P11。

练习：

2.1-3：已遍历比较的序列中，没有值等于v的元素。

2.2分析算法

分析算法的结果意味着预测算法需要的资源。通常度量计算时间。这个度量一般考虑的是单处理器，没有并发性。
算法导论书中不讨论对真实计算机中指令运行所用的时间和RAM的建模问题。

插入排序算法分析

插入排序所需的时间依赖于：输入，输入数组被排序的程度。
通常一个程序运行的时间被描述成输入规模的函数。

输入规模

其最佳概念依赖于研究的问题。也就是说，对于不同的问题，无法给出一个统一的概念。可以认为，输入中某一个量的增长会导致算法计算步骤增长的，这个量就是输入规模，例如排序算法的数组长度

运行时间

执行的基本操作或步数。步是一个抽象概念，以独立于具体的机器。书中假设执行每行伪代码需要常数时间（也就是不随输入规模而改变）。

插入排序运行时间分析

算法导论P14
注意，其中 $t_j$ 表示对于值jwhile2循环执的次数。
由于 $t_j$ 的值依赖于输入的有序性，故在输入不确定的情况下无法完全的分析算法运行时间（只能做统计分析）。书中给出了其最好运行时间： $an+b$ 和最坏运行时间 $an^2+bn+c$ ，其中a, b, c是常数，其依赖于语句代价常数。