一 算法分析基础
1.1 概念
算法复杂度是指算法在运行中所需要的计算机资源的量,算法分析是对该量的多少进行分析。所需资源越多,表明该算法复杂度越高;反之,算法复杂度越低。而计算机资源最重要的是时间和空间资源。因而,算法分析是对时间复杂度和空间复杂度进行分析。
- 时间复杂度:对算法运行时间的度量。
- 空间复杂度:对算法在运行过程中所占用存储空间大小的度量。
- 渐近复杂性态:简化算法复杂度分析的一种方法。设算法的运行时间为 T ( n ) T(n) T(n),如果存在 T ∗ ( n ) T^{*}(n) T∗(n),使得: lim n → ∞ T ( n ) − T ∗ ( n ) T ( n ) = 0 \lim\limits_{n \to \infty }\frac{T(n)-T^{*}(n)}{T(n)}=0 n→∞limT(n)T(n)−T∗(n)=0则称 T ∗ ( n ) T^{*}(n) T∗(n)为算法的渐近性态或渐近时间复杂性。
1.2渐近意义下的符号
- O O O(渐近上界):若存在两个正常数 c c c和 n 0 n_0 n0, ∀ n ⩾ n 0 \forall{n\geqslant{n_0}} ∀n⩾n0,均有 T ( n ) ⩽ c f ( n ) T(n)\leqslant{cf(n)} T(n)⩽cf(n),则称 T ( n ) = O ( f ( n ) ) T(n)=O(f(n)) T(n)=O(f(n)),也即 f ( n ) f(n) f(n)是 T ( n ) T(n) T(n)的上界。也即在 n n n满足一定条件的范围内,函数 T ( n ) T(n) T(n)的阶不高于函数 f ( n ) f(n) f(n)的阶。
- Ω \Omega Ω(渐近下界):若存在两个正常数 c c c和 n 0 n_0 n0, ∀ n ⩾ n 0 \forall{n\geqslant{n_0}} ∀n⩾n0,均有 T ( n ) ⩾ c f ( n ) T(n)\geqslant{cf(n)} T(n)⩾cf(n),则称 T ( n ) = O ( f ( n ) ) T(n)=O(f(n)) T(n)=O(f(n)),也即 f ( n ) f(n) f(n)是 T ( n ) T(n) T(n)的下界。也即在 n n n满足一定条件的范围内,函数 T ( n ) T(n) T(n)的阶不低于函数 f ( n ) f(n) f(n)的阶。
- θ \theta θ(渐近精确界):若存在三个正常数 c 1 , c 2 , n 0 c_1,c_2,n_0 c1,c2,n0, ∀ n ⩾ n 0 \forall{n{\geqslant{n_0}}} ∀n⩾n0,均有 c 2 f ( n ) ⩽ T ( n ) ⩽ c 1 f ( n ) c_2f(n)\leqslant{T(n)}\leqslant{c_1f(n)} c2f(n)⩽T(n)⩽c1f(n),则称 T ( n ) = θ f ( n ) T(n)=\theta{f(n)} T(n)=θf(n)。也即使用 θ \theta θ来表示算法的精确阶。
1.3 算法运行时间 T ( n ) T(n) T(n)建立的依据
1.3.1 非递归算法中的 T ( n ) T(n) T(n):
- 选择能够衡量算法运行时间的依据(通常为算法运行时间贡献最大的基本语句);
- 依照该依据求出运行时间 T ( n ) T(n) T(n)的表达式;
- 采用渐近符号表示 T ( n ) T(n) T(n)。
1.3.2 递归算法中的 T ( n ) T(n) T(n):
- 决定采用什么参数作为输入规模的度量;
- 找出对算法运行时间贡献最大的语句作为基本语句;
- 检查对相同规模的不同输入,基本语句执行次数是否不同。如果不同,需要从最好、最坏、平均三种情况进行分别讨论;
- 对选定的基本语句的执行次数建立递推关系式,并确定停止条件;
- 通过计算该递推关系式得到算法时间复杂度。
1.4 算法的空间复杂度
简单来说,即是算法嵌套的深度。如斐波那契数列递归栈的空间深度为 O ( n ) O(n) O(n)。
参考资料:王秋芳, 算法设计与分析[M], 清华大学出版社, 2021.