算法整理：时间复杂度篇

最新推荐文章于 2024-05-29 22:49:22 发布

原创最新推荐文章于 2024-05-29 22:49:22 发布 · 464 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#算法

算法专栏收录该内容

15 篇文章

订阅专栏

本文深入解析算法的时间复杂度概念，通过具体实例详细阐述了O、Ω和Θ等渐近记号的含义及应用，帮助读者理解算法效率评估的关键方法。

时间复杂度

什么是时间复杂度，先看一下百度描述

一般情况下，算法中基本操作重复执行的次数是问题规模 $n$ 的某个函数，用 $T (n)$ 表示，若有某个辅助函数 $g (n)$ ,存在一个正常数 $c$ 使得 $\geqslant T(n)$ 恒成立。记作 $T (n) = O (g (n))$ ，称 $O (g (n))$ 为算法的渐进时间复杂度，简称时间复杂度。

这段话什么意思？话不多说，以一个例子说明上面那段话的含义,先看一段伪代码（伪代码来源于《算法导论》）

INSERTION-SORT(A)									代价					执行次数
for j = 2 to A.length							 	 c1						n
	key = A[j]										 c2						n-1
	//Insert A[j] into the sorted A[1..j-1] 		 0						n-1
	i = j - 1 										 c4						n-1
	while i>0 and A[i]>key 							 c5						N	
		A[i+1] = A[i]								 c6						N2
		i = i - 1 									 c7						N2
	A[i+1] = key 									 c8						n-1

(上面代码中N的含义为 $N=\sum_{j=2}^nt_j$ ，N2的含义为 $N2=\sum_{j=2}^n{(t_j-1)}$ ， $t_j$ 指第 $j$ 次循环时while执行的次数)
上面是插入排序的伪代码，并且在每一行标记了代码的执行代价和执行次数，假设输入具有n个值，下面计算它的运行时间
$c_1n+c_2(n-1)+c_4(n-1)+c_5\sum_{j=2}^nt_j + c_6\sum_{j=2}^n{(t_j-1)} + c_7\sum_{j=2}^n{(t_j-1)} + c_8(n-1)$
$t_j$ 的具体值由输入的情况决定，如果输入数组已递减排序，将导致插入排序进入最坏情况，此时 $t_j=j$ ，则N和N2分别等于
$N=\sum_{i=2}^nt_j=\sum_{i=2}^nj=\frac{n(n+1)}2-1\\ N2=\sum_{i=2}^n{(t_j-1)}=\sum_{i=2}^n{(j-1)}=\frac{n(n-1)}2$
此时 $T (n) 等于$
$T(n)=(\frac{c_5}2+\frac{c_6}2+\frac{c_7}2)n^2+(c_1+c_2+c_4+\frac{c_5}2-\frac{c_6}2-\frac{c_7}2 + c_8)n+(-c_2-c_4-c_5-c_8)$
这是一个关于 $n$ 的二次函数，可以简写为： $an^2+bn+c$ 。当 $n$ 很大时，常数项和低阶项相对来说不太重要，所以忽略低阶项和常数项。同时，我们也忽略最高阶项的常系数，因为对于较大的输入，在确定计算效率时常量因子不如增长率重要。现在式子里只剩下 $n^2$ ,不妨令 $g(n)=n^2$ 。不难发现 $T (n)$ 与 $g (n)$ 有如下关系：

存在一个正的常量 $c$ ，使得 $\leqslant cg(n)$ 对于一个足够大的 $n$ 恒成立，此时记 $T (n) = O (g (n))$ 也就是 $T(n)=O(n^2)$
存在一个正的常量 $c$ ，使得 $\geqslant cg(n)$ 对于一个足够大的 $n$ 恒成立，此时记 $\Omega(g(n))$ 也就是 $\Omega(n^2)$
综合1和2，有存在两个正的常量 $c_1$ 和 $c_2$ ，使得 $c_1g(n)\leqslant T(n) \leqslant c_2g(n)$ 对于一个足够大的 $n$ 恒成立，此时记 $\Theta(g(n))$ 也就是 $\Theta(n^2)$ 。

（以上关系可以通过数学推导证明，在此不再给出，有兴趣的同学可以参考《算法导论》第三章。）

上面的 $O$ 、 $\Omega$ 和 $\Theta$ 可以在一定程度上替代T(n)衡量算法的运行时间代价，我们将这些符号称之为渐近记号。

渐近记号

渐近记号用来刻画算法的运行时间，也就是我们通常说的时间复杂度。在《算法导论》中，一共介绍了5种渐进记号，如下表所示

记号	含义	相对增长率
$\Theta(g(n))$	对于 f(n) 存在正常量 $c_1$ 、 $c_2$ 和 $n_0$ 使得对所有 $n\geqslant n_0$ ，有 $0\leqslant c_1g(n)\leqslant f(n) \leqslant c_2g(n)$	f(n) 的增长率$ =$ g(n)的增长率
$f (n) = O (g (n))$	对于 f(n) 存在正常量 $c$ 和 $n_0$ 使得对所有 $n\geqslant n_0$ ，有 $0\leqslant f(n) \leqslant cg(n)$	f(n) 的增长率 $\leqslant$ g(n)的增长率
$\Omega(g(n))$	对于 f(n) 存在正常量 $c$ 和 $n_0$ 使得对所有 $n\geqslant n_0$ ，有 $0\leqslant cg(n)\leqslant f(n)$	f(n) 的增长率 $\geqslant$ g(n)的增长率
$f (n) = o (g (n))$	对于 f(n) 存在正常量 $c > 0$ 和 $n_0>0$ 使得对所有 $n\geqslant n_0$ ，有 $0\leqslant f(n)<cg(n)$	f(n) 的增长率 $>$ g(n)的增长率
$\omega(g(n))$	对于 f(n) 存在正常量 $c > 0$ 和 $n_0>0$ 使得对所有 $n\geqslant n_0$ ，有 $0\leqslant cg(n)< f(n)$	f(n) 的增长率 $<$ g(n)的增长率

上表中的前三中记号在上一小节已经提到过，他们之间有如下关系：
定理 1
$\Theta(g(n)) = O(g(n))\cap\Omega(g(n))$

到此渐近记号的基本概念已经介绍完毕，出于完整性考虑，下面简要提一下其他细节性的概念，详情仍然可以参考《算法导论》第三章。
更多解释（可略过）

$\Theta(g(n))$ 记号： $\Theta(g(n))$ 表示函数 $f (n)$ 在一个常数因子内等于 $g (n)$ ，此时称 $g (n)$ 是 $f (n)$ 的一个渐进紧确界(asymptotically tight bound)。 $\Theta(g(n))$ 的定义要求每个成员 $f(n)\in(g(n))$ 均渐进非负，即当n足够大时，f(n)非负，所以 $g (n)$ 本身必须非负，否则 $\Theta(g(n))$ 为空。

$O (g (n))$ 记号： $\Theta(g(n))$ 记号给出了一个函数的上界和下界。当只有一个渐进上界时，使用 $O$ 记号，它给出了函数的一个在常量因子内的上界。
$O m e g a (g (n))$ 记号：类似地当只有一个渐进下界时，使用 $\Omega$ 记号，它给出了函数的一个在常量因子内的下界。
$\Theta(g(n))$ 蕴含着 $f (n) = O (g (n))$ 和 $\Omega(g(n))$ ，它是一个更强的概念，按照集合论的写法，有： $\Theta(g(n))\subset O(g(n))$ 、 $\Theta(g(n))\subset \Omega(g(n))$ 。它们的图像如下所示

$o (g (n))$ 记号：O记号提供的上界可能是也可能不是紧确的，例如 $2n = O(n^2)$ ，这个等式是正确的但不是紧确的，紧确的形式应当是 $2 n = O (n)$ 。可以使用 $o$ 记号表示一个非渐进紧确的上界。
$\omega(g(n))$ 记号：与 $o$ 记号类似， $\omega(g(n))$ 记号用来提供非渐进紧确的下界