第二章 面试中的复杂度分析
文章目录
2.1 面试中的算法复杂度分析
n n n表示数据规模, O ( f ( n ) ) O(f(n)) O(f(n))表示运行算法所需要执行的指令数,和 f ( n ) f(n) f(n)成正比。
二分查找法 | O ( l o g n ) O(logn) O(logn) | 所需要执行的指令数: a ∗ l o g n a*logn a∗logn |
---|---|---|
寻找数组中的最大/最小值 | O ( n ) O(n) O(n) | b ∗ n b*n b∗n |
归并排序法,快速排序算法 | O ( n l o g n ) O(nlogn) O(nlogn) | c ∗ n l o g n c*nlogn c∗nlogn |
选择排序法,插入排序算法 | O ( n 2 ) O(n^2) O(n2) | d ∗ n 2 d*n^2 d∗n2 |
在学术界, O ( f ( n ) ) O(f(n)) O(f(n))表示算法执行的上界;在业界,用大 O O O来表示算法执行的最低上界。
例如: O ( n l o g n + n ) = O ( n l o g n ) O(nlogn+n)=O(nlogn) O(nlogn+n)=O(nlogn)
应该注意的是,以上等式的前提是算法处理的两部分的规模n是一样的,在实际中,我们设计的可能是 O ( A l o g A + B ) O(AlogA+B) O(AlogA+B), A A A和 B B B是没有关系的,此时不能说 A l o g A > B AlogA>B AlogA>B。
例如:用邻接表实现的图进行遍历,时间复杂度: O ( V + E ) O(V+E) O(V+E), V V V和 E E E是两个规模。
一个时间复杂度的问题:
有一个字符串数组,将数组中的每一个字符串按照字母序排序;之后再将整个字符串数组按照字典序排序。整个操作的时间复杂度?
解答:
假设最长的字符串长度为 s s s(涵盖最坏的情况,可以得到上界时间复杂度);数组中有n个字符串。
1.对每个字符串排序: O ( s l o g s ) O(slogs) O(slogs);将每个字符串按照字母序排序: O ( n ∗ s l o g s ) O(n*slogs) O(n∗slogs)
2.将整个字符串数组按照字典序排序: O ( s ∗ n l o g n ) O(s*nlogn) O(s∗nlogn);排序算法中复杂度 O ( n l o g n ) O(nlogn) O(nlogn)的认识:表示的是比较的次数。通常所说两个整型数组进行排序,进行 n l o g n nlogn nlogn次比较,这是因为整数之间的比较在计算机中的时间复杂度是 O ( 1 ) O(1) O(1)级别;两个字符串的比较不同,需要看字典序是在前还是在后,比较的过程还需要耗费**O(s)**也就是字符串长度的消耗,所以说的 O ( s n l o g n ) O(snlogn) O(snlogn)。
整个时间复杂度就是: O ( n ∗ s l o g s + s ∗ n l o g n ) O(n *slogs+s *nlogn) O(n∗slogs+s∗nlogn)。
2.2 对数据规模有一个概念
2.2.1 数据规模概念程序实例:
#include "stdafx.h"
#include <math.h>
#include <iostream>
#include <time.h>
using namespace std;
int main()
{
int x = 0;
int n = 0;
for (x = 0; x <= 9; x++){
n = pow(10, x);
clock_t start = clock();
int sum = 0;
for (int i = 0; i < n; i++) {
sum = sum + i;
}
clock_t end = clock();
cout << "10^" << x <<":"<< double(end - start) / CLOCKS_PER_SEC << endl;
}
return 0;
}
结果可以看到,函数是O(n)级别的复杂度算法。
要想在1s内解决问题:
O ( n ) O(n) O(n)可以处理大约 1 0 8 10^8 108级别的数据;
O ( n 2 ) O(n^2) O(n2)可以处理大约 1 0 4 10^4 104级别的数据;
O ( n l o g n ) O(nlogn) O(nlogn)可以处理大约 1 0 7 10^7 107级别的数据( l o g 1 0 7 log10^7 log107约为10)
可以通过数据的多少,确定要设计的时间复杂度预处理。
2.2.2 空间复杂度:
开了多大的辅助空间,就说用了多大的空间复杂度。
多开一个辅助的数组: O ( n ) O(n) O(n)
多开一个辅助的二维数组: O ( n 2 ) O(n^2) O(n2)
多开常数数组: O ( 1 ) O(1) O(1)(原地排序算法,只要开临时的变量)
需要注意的是,递归的调用有空间代价。递归的深度就是递归的复杂度。
2.3 常见的代码模式对应的时间复杂度
O ( 1 ) O(1) O(1):
没有数据规模的变化,例如数的swap函数
O ( n ) O(n) O(n):
典型的特征是有一个循环,且循环的次数和 n n n相关。基本的时间操作是 c ∗ n c*n c∗n次(注意 c c c是常数,可以大于1,也可以小于1:例如字符串的swap算法,前面和后面的调换)
O ( n 2 ) O(n^2) O(n2):
执行的指令数和
n
2
n^2
n2成比例,有两个循环,每重循环都和
n
n
n正相关。例如1:外循环int i=0;i<n;i++
,内循环int j=i+1;j<n;j++
。此时,执行的指令数是
(
n
−
1
)
+
(
n
−
2
)
+
(
n
−
3
)
+
.
.
.
+
0
=
1
/
2
∗
n
2
−
1
/
2
∗
n
(n-1)+(n-2)+(n-3)+...+0=1/2*n^2-1/2*n
(n−1)+(n−2)+(n−3)+...+0=1/2∗n2−1/2∗n,时间复杂度是
O
(
n
2
)
O(n^2)
O(n2)。
但不是每次双重循环都是
O
(
n
2
)
O(n^2)
O(n2),例如2:外循环int i=0;i<n;i++
,内循环int j=1;j<=30;j++
。此时第二重循环执行的次数是固定的和
n
n
n无关,总共执行
30
n
30n
30n次操作,时间复杂度为
O
(
n
)
O(n)
O(n)。
例如3:外循环int sz=1;sz<n;sz+=sz
,内循环int i=1;i<n;i++
,此时外循环是从1开始,每次“乘以2”,最后直到超过n,问题变成了sz经过几次“乘2”最终达到n,时间复杂度
O
(
l
o
g
n
)
O(logn)
O(logn);第二层循环是
O
(
n
)
O(n)
O(n)级别,所以一共是
O
(
n
l
o
g
n
)
O(nlogn)
O(nlogn)级别。
所以说要注意循环的起始点,中止点,每次的增量变化。
O ( l o g n ) O(logn) O(logn):
二分查找法是 O ( l o g n ) O(logn) O(logn)级别,每次都比较比较元素和中间元素的大小关系,每次丢掉一般的元素, n → n / 2 → n / 4 → . . . → 1 n\rightarrow n/2\rightarrow n/4\rightarrow ...\rightarrow 1 n→n/2→n/4→...→1。n经过几次“除以2”的操作以后等于1: l o g 2 n = O ( l o g n ) log_2n=O(logn) log2n=O(logn)。
再例如: n n n经过几次“除以10”的操作以后等于0: l o g 10 n = O ( l o g n ) log_{10}n=O(logn) log10n=O(logn)。
l o g a n = l o g a b ∗ l o g b n log_an=log_ab*log_bn logan=logab∗logbn,所以说以上两个都是 O ( l o g n ) O(logn) O(logn)复杂度的。
O ( s q r t ( n ) ) O(sqrt(n)) O(sqrt(n)):
循环:int x=2;x*x<=n;x++
2.4 复杂度试验
通过试验,观察变化趋势,每次数据规模提高2倍。
O ( ( 2 n ) 2 ) / O ( n 2 ) = 4 O((2n)^2)/O(n^2)=4 O((2n)2)/O(n2)=4; O ( 2 n ) / O ( n ) = 2 O(2n)/O(n)=2 O(2n)/O(n)=2
此处要注意的是,算法复杂度是 O ( l o g n ) O(logn) O(logn)级别的, l o g 2 n / l o g n = 1 + l o g 2 / l o g n log2n/logn=1+log2/logn log2n/logn=1+log2/logn, O ( l o g n ) O(logn) O(logn)的复杂度很优秀啊,算法的时间变化很小。启示:顺序查找转换成二分查找。
2.5 递归算法的复杂度分析
不是有递归的函数就一定是 O ( l o g n ) O(logn) O(logn),具体问题具体分析!
递归中进行一次递归调用的时间复杂度分析:
没听懂诶!
归并排序+快速排序
二分查找的递归实现
求和递归实现
计算x的n次方的幂运算
递归中多次进行递归调用,递归树
归并排序
分治算法
2.6 均摊复杂度分析
一个算法的复杂度相对较高,但是这个算法的复杂度是为了方便其他的操作,所以需要将一个算法的复杂度和其他操作的复杂度一起计算,将其均摊到其他算法上去。