陈越《数据结构》第一讲基本概念

最新推荐文章于 2024-06-27 19:08:24 发布

Paul-Huang

最新推荐文章于 2024-06-27 19:08:24 发布

阅读量4.3k

点赞数 2

CC 4.0 BY-SA版权

分类专栏：陈越数据结构 PTA 文章标签：陈越数据结构

本文链接：https://blog.youkuaiyun.com/huang1024rui/article/details/72935203

PTA 同时被 2 个专栏收录

11 篇文章

订阅专栏

陈越数据结构

8 篇文章

订阅专栏

本文讲解了数据结构的基本概念，包括数据对象的组织方式、算法的定义及其评价标准，并通过实例探讨了不同算法的效率问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

陈越《数据结构》第一讲基本概念

1什么是数据结构

1.1 引子

例子：如何在书架上摆放图书？

随便放；
按照书名的拼音字母顺序排放；
把书架划分成几块区域，每块区域指定摆放某种类别的图书；在每种类别内，按照书名的拼音字母顺序排放。

$解决问题方法的效率，跟数据的组织方式有关。\color{red}{解决问题方法的效率，跟数据的组织方式有关。}$

例2：写程序实现一个函数PrintN，使得传入一个正整数为N的参数后，能顺序打印从1到N的全部正整数。

循环实现；
递归实现。//数值从 $10到10^6$
$解决问题方法的效率，跟空间的利用效率有关。\color{red}{解决问题方法的效率，跟空间的利用效率有关。}$

例3：写程序计算给定多项式在给定点x处的值。

利用 $p + = (a [i] * p o w (x, i));$ 进行计算；

秦九韶利用 $p = a [i - 1] + x * p;$ 进行计算；
用 time.h中的常数CLK_TCK，clock_t start, stop;计算时间。
$解决问题方法的效率，跟算法的巧妙程度有关。\color{red}{解决问题方法的效率，跟算法的巧妙程度有关。}$

即：解决问题方法的效率，跟数据的组织方式、跟空间的利用效率和跟算法的巧妙程度有关。

数据结构是：

$数据对象\color{red}{数据对象}$ 在计算机中的组织方式(逻辑结构、物理存储结构)；
2.数据对象必定与一系列加在其上的 $操作\color{red}{操作}$ 相关联；
3.完成这些操作所用的方法就是 $算法\color{red}{算法}$ 。

1.2 抽象数据类型

数据结构

数据对象在计算机中的组织方式(逻辑结构、物理存储结构)；
数据对象操作的关联关系；
数据对象的最高效算法。

抽象数据类型

数据类型

数据对象集;
数据集合相关联的操作集。

抽象(描述数据类型的方法不依赖于具体实现)

与存放数据的机器无关;
与数据存储的物理结构无关;
与实现操作的算法和编程语言均无关。

2. 什么是算法

$算法（Algorithm）\color{red}{算法（Algorithm ）}$ 定义：

一个有限指令集;
接受一些输入（有些情况下不需要输入）;
产生输出(必须);
一定在有限步骤之后终止；
每一条指令必须：
有充分明确的目标，不可以有歧义；
计算机能处理的范围之内；
描述应不依赖于任何一种计算机语言以及具体的实现手段。

2.1什么是好的算法？

$空间复杂度S(n)\color{red}{空间复杂度S(n)}$ 占用存储单元的长度。
$时间复杂度T(n)\color{red}{时间复杂度T(n)}$ 耗费时间的长度。

在例3中，第一种方法的时间复杂度是 $T(n) = C_1n^2+C_2n$ ；秦九韶的时间复杂度是 $T (n) = C . n$ 。

在分析一般算法的效率时，我们经常关注下面两种复杂度：

$最坏情况复杂度\color{red}{最坏情况复杂度}$ $T_{worst}( n )$ ;
$平均复杂度\color{red}{平均复杂度}$ $T_{avg}( n )$ 。
其中我们最关心 $最坏情况复杂度\color{red}{最坏情况复杂度}$ 。

2.2 一些基本概念

$复杂度的渐进表示法\color{red}{复杂度的渐进表示法}$

上界： $T (n) = O (f (n))$ ；
下界： $T (n) = Ω (g (n))$ ；
上下界等价： $T (n) = Θ (h (n)); Θ (h (n)) = O (f (n)) ， Θ (h (n)) = Ω (g (n))$ 。
$我们写O(f(n))时，是写最小上界，写Ω(g(n)时，是写最大下界，这样才有意义。\color{red}{我们写{O(f(n))}时，是写最小上界，写Ω(g(n)时，是写最大下界，这样才有意义。}$

这里写图片描述

$复杂度的渐进表示法\color{red}{复杂度的渐进表示法}$

若两段算法分别有复杂度 $T_1(n) = O(f_1(n))$ 和 $T_2(n) =O(f_2(n))$ ，则:

$T_1(n)+T_2(n)=max( O(f_1(n)),O(f_2(n)))$ ;
$T_1(n) * T_2(n) = O( f_1(n) * f_2(n) )。$

若 $T (n)$ 是关于 $n的k阶多项式\color{red}{n的k阶多项式}$ ，那么起作用的是最大项，即 $T(n)=Θ(nk);\color{red}{T(n)=Θ(n^k);}$

$一个for循环的时间复杂度\color{red}{一个for循环的时间复杂度}$ 等于 $循环次数\color{red}{循环次数}$ 乘以 $循环体代码的复杂度；\color{red}{循环体代码的复杂度；}$

$if−else结构\color{red}{if-else 结构}$ 的复杂度取决于if的条件判断复杂度和两个分枝部分的复杂度， $总体复杂度取三者中最大；\color{red}{总体复杂度取三者中最大；}$

$O(n2)复杂度的算法本能的优化为O(nlogn)。\color{red}{O(n^2)复杂度的算法本能的优化为O(n log n)。}$

3.应用实例：最大子列和问题

应用实例：最大子列和问题

01 - 复杂度1 最大子列和问题(20分)
例如给定序列 ${ -2, 11, -4, 13, -5, -2 \}$ ，其连续子列 ${ 11, -4, 13 \}$ 有最大的和 $20$ 。现要求你编写程序，计算给定整数序列的最大子列和。

本题旨在测试各种不同的算法在各种数据情况下的表现。各组测试数据特点如下：
- 数据1：与样例等价，测试基本正确性；
- 数据2： $10^2$ 个随机整数；
- 数据3： $10^3$ 个随机整数；
- 数据4： $10^4$ 个随机整数；
- 数据5： $10^5$ 个随机整数；
输入格式 :
输入第1行给出正整数K(≤100000)；第2行给出K个整数，其间以空格分隔。
输出格式 :
在一行中输出最大子列和。如果序列中所有整数皆为负数，则输出0。
输入样例 :

6
-2 11 -4 13 -5 -2
输出样例 :

20

$解决方法:\color{red}{解决方法}:$

时间复杂度为 $T( N ) = O( N^3 )$ ;
时间复杂度为 $T( N ) = O( N^2 )$ ;
时间复杂度为 $T (N) = O (N l o g N)$ ;（分而治之）
时间复杂度为 $T (N) = O (N)$ 。（在线处理）

时间复杂度为 $T( N ) = O( N^2 )$ 的代码：

#include<stdio.h>
#include<iostream>

#define MAXN 100000
int arr[MAXN];

int MaxSubseqSum(int A[], int N);

int main()
{
	int i, n;

	scanf("%d",&n);
	for (i = 0; i < n; i++)
		scanf("%d",&arr[i]);
	printf("%d\n",MaxSubseqSum(arr,n));
	system("pause");
	return 0;
}

int MaxSubseqSum(int A[], int N)
{
	int ThisSum, MaxSum = 0;
	int i, j;

	for (i = 0; i < N; i++)
	{
		ThisSum = 0;
		for (j = i; j < N; j++)
		{
			ThisSum = ThisSum + A[j];
			if (ThisSum > MaxSum)
				MaxSum = ThisSum;
		}		
	}
	return MaxSum;
}

分而治之的代码：

#include<stdio.h>
#include<iostream>
#define MAXN 100000
int arr[MAXN + 10];

int maxThree(int a,int b,int c);
int maxSubSeq(int arr[],int low,int height);
int maxSubSeq1(int arr[],int n);
int main()
{
	int i, n;
    
    scanf("%d", &n);
    for(i = 0; i < n; i++)
        scanf("%d", &arr[i]); 
	printf("%d\n", maxSubSeq(arr, 0, n-1));
	system("pause");
    return 0;
}
int maxSubSeq1(int arr[],int n)
{
	int i = 0, iThisSum = 0, iMaxSum = 0;
	 for(i = 0; i < n; i++)
    {
        iThisSum += arr[i];
		if(iThisSum > iMaxSum) iMaxSum = iThisSum;
        else if(iThisSum < 0) iThisSum = 0;
    }
	 return iMaxSum;
}
int maxSubSeq(int arr[], int low, int height)
{
	int i = 0, iMid = 0, iThisSum = 0, iLeftMax = 0, iRightMax = 0, iLeftMaxSum = 0, iRightMaxSum = 0;
	if(low >= height) return arr[low];
	iMid = (low + height)/2;
	iLeftMax = maxSubSeq(arr,low,iMid);//左边最大
	iRightMax = maxSubSeq(arr,(iMid+1),height);//右边最大
	//中间（跨越）最大
	iThisSum = iLeftMaxSum = 0;
	for(i = iMid ; i >low ; i-- )
	{
		iThisSum += arr[i];
		if(iThisSum > iLeftMaxSum) iLeftMaxSum = iThisSum;
	}
	iThisSum = iRightMaxSum = 0;
	for(i = iMid ; i <height ; i++)
	{
		iThisSum += arr[i];
		if(iThisSum > iRightMaxSum) iRightMaxSum = iThisSum;
	}

	return maxThree(iLeftMax , iRightMax, (iRightMaxSum + iLeftMaxSum));

}
int maxThree(int a,int b,int c)
{
	int max = a;
	if(b > max) max = b;
	if(c > max) max = c;
	return max;
}