数据结构之复杂度

数据结构

什么是数据结构?

数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合。

什么是算法?

算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。

复杂度是什么?

复杂度是用来分析程序和算法运行的时间和空间占用情况的分析

1.时间复杂度(重点关注)

定义:算法的时间复杂度是一个函数(数学里面的计算一个值的表达式,不是计算算法运行时间,因为不同的电脑运行环境不同,计算出来的结果没有意义,它算的是程序执行的大概次数。

1.时间复杂度为:F(N)=N*N+2*N+10
用大O的渐进表示法以后,Func1的时间复杂度为::O(N*N)
void Func1(int N)
 {
 int count = 0;
 for (int i = 0; i < N ; ++ i)
 {
    for (int j = 0; j < N ; ++ j)
    {
        ++count;
    }
 }
    
for (int k = 0; k < 2 * N ; ++ k)
 {
    ++count;
 }
 int M = 10;
 while (M--)
 {
    ++count;
 }
  printf("%d\n", count);
 }

实际中我们计算时间复杂度时,我们其实并不一定要计算精确的执行次数,而只需要大概执行次数,那么这里我们使用大O的渐进表示法。

大O的渐进表示法
大O符号(Big O notation):是用于描述函数渐进行为的数学符号。
推导大O阶方法:
1、用常数1取代运行时间中的所有加法常数。
2、在修改后的运行次数函数中,只保留最高阶项。
3、如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结果就是大O阶。

另外有些算法的时间复杂度存在最好、平均和最坏情况:
最坏情况:任意输入规模的最大运行次数(上界)
平均情况:任意输入规模的期望运行次数
最好情况:任意输入规模的最小运行次数(下界)
例如:在一个长度为N数组中搜索一个数据x
最好情况:1次找到
最坏情况:N次找到
平均情况:N/2次找到
在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)

3.在数组中查找一个数:复杂度会变

分三种情况:

1.最好:

2.最坏:

3.平均:

时间复杂度是悲观的情况:计算最坏的情况是最能让人容易接受的

4.计算时间复杂度怎么算:算过程如冒泡排序:两项相比将较大的往后交换。

 // 计算Func2的时间复杂度?
2.时间复杂度为:F(N)=2*N+10
用大O的渐进表示法以后,Func2的时间复杂度为::O(N)
void Func2(int N)
 {
    int count = 0;
    for (int k = 0; k < 2 * N ; ++ k)
    {
        ++count;
    }
int M = 10;
while (M--)
{
    ++count;
}
 
printf("%d\n", count);
}



3.时间复杂度为:F(N)=M+N
用大O的渐进表示法以后,Func3的时间复杂度为::O(M+N)
// 计算Func3的时间复杂度?
void Func3(int N, int M)
 {
    int count = 0;
    for (int k = 0; k < M; ++ k)
    {
        ++count;
    }
    for (int k = 0; k < N ; ++ k)
{
    ++count;
}
printf("%d\n", count);
}
4.时间复杂度为:F(N)=100
用大O的渐进表示法以后,Func4的时间复杂度为::O(1)【表示常数次】
// 计算Func4的时间复杂度?
void Func4(int N)
 {
    int count = 0;
    for (int k = 0; k < 100; ++ k)
    {
        ++count;
    }
    printf("%d\n", count);

}
5.时间复杂度为:F(N)=(n*n+n)/2
用大O的渐进表示法以后,时间复杂度为::O(n*n)
最好的情况:O(n){其中外层循环执行1轮,内层循环虽然执行拿次比较,但未触发任何交换就终止了算法,所以总操作量是O(n)}
// 冒泡排序:计算BubbleSort的时间复杂度?
//不能用循环次数直接求时间复杂度
void BubbleSort(int* a, int n)
 {
    assert(a);
    for (size_t end = n; end > 0; --end)
    {
        int exchange = 0;
        for (size_t i = 1; i < end; ++i)
        {
            if (a[i-1] > a[i])
            {
                Swap(&a[i-1], &a[i]);
                exchange = 1;
            }
        }
 
        if (exchange == 0)
            break;
    }
 }
 依下图:
 F(n)=1+2+...+n-1=(n*n+n)/2
外层循环123n
内层循环012n-1
总次数012n-1
6.时间复杂度为:F(N)=log以2为底n的对数
用大O的渐进表示法以后,时间复杂度为:O(log以2为底n的对数)
//二分查找:数组是有序的
// 计算BinarySearch的时间复杂度?
int BinarySearch(int* a, int n, int x)
 {
    assert(a);
 
    int begin = 0;
    int end = n-1; 
    // [begin, end]:begin和end是左闭右闭区间,因此有=号
    while (begin <= end)
    {
        int mid = begin + ((end-begin)>>1);
        if (a[mid] < x)
            begin = mid+1;
        else if (a[mid] > x)
            end = mid-1;
        else
            return mid;
    }
 
    return -1;
 }
 假设原来数组中有n个元素,经过x次查找后只剩下一个元素,所以就可以得到2的x次方为n,求得x=log以2为底n的对数,所以时间复杂度为x=log以2为底n的对数
// 计算阶乘递归Fac的时间复杂度?
时间复杂度为:F(N)=n
用大O的渐进表示法以后,时间复杂度为:O(n)
递归算法如何计算:递归次数*每次递归函数的次数
long long Fac(size_t N)
 {
    if(0 == N)
        return 1;
    
    return Fac(N-1)*N;
 }
 // 计算斐波那契递归Fib的时间复杂度?
 时间复杂度为:F(N)=n
用大O的渐进表示法以后,时间复杂度为:O(n)
//注:n比较大一点的话,运行会非常慢
long long Fib(size_t N)
 {
    if(N < 3)
        return 1;
    
    return Fib(N-1) + Fib(N-2);
 }
 
 //改进:
 //优化:我们发现:递归去计算会有非常多的重复
 long long * Fibonacci(size_t N)
 {
 	long long * fibArry = malloc(sizeof(long long)*(N+1));//多开辟一个空间避免N为0时数组越界
 	fibArray[0] = 1;
 	if(N == 0)
 		return fibArray;
 	fibArray[1] = 1;
 	//以空间换时间
 	for(int i = 2; i < N; ++i)
 	{
 		fibArray[i] = fibArray[i-1] + fibArray[i-2];
 	}
 }
 //实现
 int main()
 {
 printf("%d\n", FibArray(50));
 return 0;
 }

2.空间复杂度(了解)

空间复杂度不计算其占用字节,也就是不计算空间,计算大概定义的变量个数

 // 计算BubbleSort的空间复杂度?
 空间复杂度(定义变量个数:5个):O(1)
void BubbleSort(int* a, int n)
 {
 
 	assert(a);
 	for (size_t end = n; end > 0; --end)
 	{
 		int exchange = 0;
 		for (size_t i = 1; i < end; ++i)
		 {
 			if (a[i-1] > a[i])
 			{
 				Swap(&a[i-1], &a[i]);
 				exchange = 1;
 				}
 			}
 		if (exchange == 0)
 		break;
 	}
 }	
// 计算Fibonacci的空间复杂度?
// 返回斐波那契数列的前n项
空间复杂度(定义变量个数:n+1个):O(n)
long long* Fibonacci(size_t n)
 {
 	if(n==0)
 	return NULL;
 	//开辟了n+1个空间,+1忽略掉
 	long long * fibArray = (long long *)malloc((n+1) * sizeof(long long));
	 fibArray[0] = 0;
 	 fibArray[1] = 1;
 for (int i = 2; i <= n ; ++i)
    {
 		fibArray[i] = fibArray[i - 1] + fibArray [i - 2];
    }
 return fibArray;
 }
 // 计算阶乘递归Fac的空间复杂度?
 空间复杂度:O(n)
long long Fac(size_t N)
 {
 	if(N == 0)
 		return 1;
 	return Fac(N-1)*N;
 }
//计算斐波那契数列空间复杂度是多少
空间复杂度:O(n)
long long Fib(size_t N)
 {
    if(N < 3)
        return 1;
    
    return Fib(N-1) + Fib(N-2);
 }
<think>好的,用户之前问过如何学习数据结构,现在又具体问到了时间复杂度。我需要先回顾一下之前的回答,确保内容连贯。在之前的回答中,我提到了时间复杂度的基本概念和大O表示法,现在用户可能希望更深入的理解。 首先,我需要判断用户的背景。可能是刚开始学习计算机科学的学生,或者转行学习编程的人士。他们可能对算法效率有初步了解,但需要系统的解释和实际例子。 用户的需求是了解数据结构的时间复杂度。需要涵盖常见数据结构的基本操作的时间复杂度,比如数组、链表、栈、队列、树、图等。同时,应该解释为什么这些操作会有这样的复杂度,比如链表插入为什么是O(1),而数组插入可能是O(n)。 还要注意用户可能的误区,比如混淆平均情况和最坏情况,或者不理解摊还分析的概念。例如,动态数组的摊还时间复杂度可能容易让人困惑,需要举例说明,比如ArrayList的扩容机制。 另外,用户可能想知道如何分析自己代码的时间复杂度,或者如何选择合适的数据结构来优化算法。所以,需要提供一些分析方法,比如循环嵌套、递归的时间复杂度计算,以及不同数据结构适用的场景比较。 在之前的回复中,我已经提到了时间复杂度的计算和大O表示法,现在需要更详细地展开,包括各种常见的时间复杂度类别,如O(1), O(log n), O(n), O(n log n), O(n²)等,并给出对应的例子,比如哈希表访问是O(1),二分查找是O(log n)。 还要注意数据结构的操作,比如插入、删除、查找,不同数据结构的这些操作可能有不同的时间复杂度,需要分别说明。例如,在数组中,查找元素是O(n),但通过索引访问是O(1);在二叉搜索树中,查找平均是O(log n),最坏是O(n),而平衡树如AVL能保持O(log n)。 可能需要用表格来清晰展示不同数据结构的操作复杂度,但用户要求使用中文且格式可能有要求,所以需要适当用文字描述。此外,强调时间复杂度的实际意义,比如数据量增大时的性能影响,帮助用户理解为什么需要关注时间复杂度。 最后,提醒用户注意常见误区,比如忽略常数因子、最坏情况与平均情况的区别,以及空间复杂度与时间复杂度的权衡。可能还需要给出学习建议,比如如何练习分析代码的时间复杂度,推荐练习题或资源。</think>我将为您详细解析数据结构中的时间复杂度概念,通过分类解析+实例演示的方式帮助您建立系统认知。以下是结构化讲解: --- ### 一、时间复杂度的本质含义 时间复杂度衡量**算法执行时间随数据规模增长的变化趋势**,使用大$O$$符号表示。核心关注点: $$T(n) = O(f(n)) \text{ 表示存在常数C,当n足够大时} T(n) \leq C \cdot f(n)$$ --- ### 二、常见数据结构操作复杂度速查表 #### 1. 线性结构 | 数据结构 | 访问元素 | 插入/删除(头) | 插入/删除(尾) | 查找元素 | |-------------|----------|---------------|---------------|----------| | 数组 | $O(1)$ | $O(n)$ | $O(1)$ | $O(n)$ | | 链表 | $O(n)$ | $O(1)$ | $O(1)$ | $O(n)$ | | 动态数组 | $O(1)$ | $O(n)$ | $O(1)$* | $O(n)$ | | 栈(数组实现)| $O(1)$ | $O(1)$ | - | - | > *注:动态数组尾部插入摊还分析为$O(1)$ #### 2. 树形结构 | 数据结构 | 查找 | 插入 | 删除 | 遍历 | |---------------|----------|----------|----------|----------| | 二叉搜索树 | $O(n)$ | $O(n)$ | $O(n)$ | $O(n)$ | | AVL树 | $O(\log n)$ | $O(\log n)$ | $O(\log n)$ | $O(n)$ | | 堆(优先队列) | $O(1)$ | $O(\log n)$ | $O(\log n)$ | - | #### 3. 哈希结构 | 操作 | 平均复杂度 | 最坏复杂度 | |---------------|------------|------------| | 插入 | $O(1)$ | $O(n)$ | | 查找 | $O(1)$ | $O(n)$ | | 删除 | $O(1)$ | $O(n)$ | --- ### 三、复杂度分析实战方法 #### 例1:数组去重算法 ```python def remove_duplicates(arr): result = [] # O(1) seen = set() # O(1) for num in arr: # 循环n次 if num not in seen: # 集合查询O(1) seen.add(num) # 集合插入O(1) result.append(num) # 列表追加O(1) return result # 总时间复杂度 O(n) ``` #### 例2:二分查找 ```python def binary_search(arr, target): left, right = 0, len(arr)-1 # O(1) while left <= right: # 循环次数 log₂n mid = (left + right) // 2 if arr[mid] == target: return mid elif arr[mid] < target: left = mid + 1 else: right = mid - 1 return -1 # 总时间复杂度 O(log n) ``` --- ### 四、复杂度层级对比(n=1,000,000时) | 复杂度 | 操作次数 | 实际耗时参考 | |-------------|---------------|---------------| | $O(1)$ | 1 | 1纳秒 | | $O(\log n)$ | ~20 | 20纳秒 | | $O(n)$ | 1,000,000 | 1毫秒 | | $O(n\log n)$| ~20,000,000 | 20毫秒 | | $O(n^2)$ | 1,000,000,000 | 1秒~30秒 | --- ### 五、高级分析技巧 1. **摊还分析**: - 动态数组扩容:每次扩容需要$O(n)$,但均摊到每次插入操作后仍为$O(1)$ $$ \text{均摊成本} = \frac{\sum_{k=0}^{\log n} 2^k}{n} \approx O(1) $$ 2. **递归复杂度**: - 归并排序递推公式: $$ T(n) = 2T(n/2) + O(n) \Rightarrow T(n) = O(n\log n) $$ 3. **空间-时间权衡**: - 使用哈希表存储中间结果,将查找时间从$O(n)$降为$O(1)$ --- ### 六、常见误区警示 1. **忽略隐藏成本**: - 链表节点创建/销毁的时间开销 - 哈希表冲突处理带来的额外消耗 2. **错误比较复杂度**: - $O(1000n)$ 仍属于$O(n)$级别 - $O(n^2 + n)$ 简化为$O(n^2)$ 3. **场景误判**: - 数据规模较小时,$O(n^2)$可能快于$O(n\log n)$ - 缓存局部性对数组操作的实际影响 --- **学习建议**: 1. 每实现一个数据结构,手动计算各操作复杂度 2. 在LeetCode解题时,先分析最优解的理论复杂度 3. 使用Python的`timeit`模块验证实际运行时间与理论分析的对应关系
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值