文章目录
第一章 绪论
概览
需要具备的知识C/C++语言
数据结构的基本概念
- 数据
- 数据元素、数据项
- 数据对象、数据结构
数据
- 数据是信息的载体,是描述客观事物属性的树、字符及所有能输入到计算机中并被计算机程序识别和处理的符号的集合,数据是计算机程序加工的原料
现代计算机:经常处理非数值型问题,对于非数值型问题
- 我们关心每个个体的具体信息
- 我们还关心个体之间的关系
数据元素、数据项
- 数据元素,描述一个个体
- 数据元素是数据的基本单位,通常作为一个整体进行考虑和处理。如一个人的财富信息
- 一个数据元素可以由若干数据项组成,数据项是构成数据元素不可分割的最小单位
数据对象是具有相同性质的数据元素的集合,是数据的一个子集
数据结构三要素
逻辑结构
- 集合:各元素同属一个集合,别无其他关系
- 线性结构:数据元素是一对一的关系,除了第一个元素,所有元素都有唯一的前驱,除了最后一个元素,所有元素都有唯一后继
- 树形结构:数据元素之间存在一对多的关系
- 图结构:也叫网状结构,数据元素之间是多对多的关系
基本运算,如
- 查找第i个数据元素
- 在第i个位置插入新的数据元素
- 删除第i个位置的数据元素
数据的物理结构(存储结构):如何用计算机表示数据元素的逻辑关系
以线性结构为例,可以有顺序存储,链式存储,索引存储,散列存储
- 顺序存储:逻辑上相邻的元素存储在物理位置上也相邻的存储单元中,元素之间的关系由存储单元的邻接关系来体现
- 链式存储:逻辑上相邻的元素在物理位置上可以不相邻,借助指示元素存储地址的指针来表示元素之间的逻辑关系
- 索引存储:在存储元素信息的同时,还建立附加的索引表,索引表中的每项成为索引项,索引项的一般形式是(关键字,地址)
存储结构
- 数据的存储结构会影响存储空间分配的方便程度
- 数据的存储结构会影响对数据运算的速度
运算
- 运算的定义是针对逻辑结构的,指出运算的功能
- 运算的实现是针对存储结构的,指出运算的具体操作步骤
数据类型、抽象数据类型
- 数据类型是一个值的集合和定义在此集合上的一组操作的总称
- 原子类型:其值不可再分的数据类型
- 结构类型:其值可以再分解成若干成分(分量)的数据类型
- 抽象数类型ADT:是抽象数据组织及与之相关的操作
什么是算法
- 程序=数据结构+算法
- 算法是对特定问题求解步骤的一种描述,它是指令的有限序列,其中的每条指令表示一个或多个操作
算法特性
- 有穷性:一个算法必须总在有穷步之后结束,且每一步都可以在有穷时间内完成。算法必须是有穷的,程序可以是无穷的。如,微信是程序,不是算法
- 确定性:算法中每条指令必须有确切的含义,对于相同的输入只能得出相同的输出。
- 可行性:算法中描述的操作都可以通过已经实现的基本运算执行有限次来实现
- 输入:一个算法有零个或多个输入,这些输入取自某个特定的对象的集合
- 输出:一个算法有一个或多个输出,这些输出是与输入有着某种特定关系的量
好的算法的特质
- 正确性:正确的解决问题
- 可读性:具有良好的可读性,方便人们理解
- 健壮性:输入非法数据时,算法能适当做出反应或处理,不会产生莫名其妙的输出结果
- 高效率与低存储量需求。高效率指时间复杂度低,低存储量指空间复杂度低。
算法时间复杂度 - 让算法事先运行,事后统计运行时间存在诸多问题,不适宜。
- 算法时间复杂度:事前预估算法的时间开销T(n)与问题规模n的关系
- 思考:表达式千差万别,是否可以忽略某些部分;如果有很多行,是否要一行一行数
简化时间复杂度表达式
- 只保留阶数高的部分,且系数变为1;其实就是求极限,找同阶
- 加法规则:多项相加,只保留最高阶项,且系数变为1
- 乘法规则:多项相乘,合并,结果再保留最高阶项,且系数变为1
- 常见的数量级阶数排序,如图,口诀:常对幂指阶
是否一行一行数
- 顺序执行的代码只会影响常数项,可以忽略
- 只需要挑循环中的一个基本操作分析它的执行次数与n的关系即可
- 如果有多层嵌套循环,只需关注最深层循环了几次
最好,最坏,平均
- 最坏时间复杂度:最坏情况下算法的时间复杂度
- 平均时间复杂度:所有输入示例等概率出现的情况下,算法的期望运行时间
- 最好时间复杂度:最好情况下算法的时间复杂度,一般不用
算法的性能问题只有在n很大的时候才会体现出来
算法空间复杂度
- 也采用O表示法,只需关注存储空间大小与问题规模相关的变量
- 算法原地工作:算法所需内存空间为常量,无论问题规模怎么变,算法运行所需的内存空间为固定的常量
- 空间复杂度同样适用加法规则,乘法规则,复杂度排序表
- 存储变量会导致内存开销,函数调用也会导致内存开销增加,比如递归,每调用一次,就要重新声明一次变量
- 自行查资料:函数调用栈
- 考试中大多情况考察,空间复杂度=递归调用的深度,每一层调用所增加的存储参数的空间可能相同,也可能不同
考试中大多考察算法时间复杂度,空间复杂度考的较少,有也是看递归调用的深度
第二章 线性表
线性表的定义,基本操作
线性表是具有相同数据类型的n个数据元素的有限序列,其中n为表长,n=0时线性表是一个空表,若用L命名线性表,则一般表示为L=(a1,a2,…an)
要点:相同类型,有限,有次序
几个概念:
- ai是线性表中的第i个元素在线性表中的位序
- a1是表头元素,an是表尾元素,除第一个元素外,每个元素有且仅有一个直接前驱;除最后一个元素外,每个元素有且仅有一个直接后继
基本操作
- 初始化,销毁,插入,删除,按值查找,按位查找;求表长,输出,判空
- 记忆思路:创建,销毁,增删改查
- 实际开发中,可根据实际需求定义其他类型的基本操作
- 重点理解:对参数的修改结果需要带回来,则传入引用符号&,这是C++语法,需要使用C++编译器
怎样实现线性表
线性表:是具有相同数据类型的n(n>0)个数据元素的有限序列
顺序表的定义,存储结构,实现,特点
顺序表:用顺序存储的方式实现线性表的顺序存储。把逻辑上相邻的元素存储在物理位置上也相邻的存储单元中,元素之间关系由存储单元的临界关系来体现
顺序表的实现-静态分配
如果不进行初始化,可能的后果
C语言不是会给新元素设置初始值么?这是编译器做的,受限于编译器
如果数组满了怎么办?放弃治疗,因为顺序表的长度确定以后就无法更改;刚一开始就申请大还浪费
顺序表的实现–动态分配
具体代码实现
顺序表的特点
- 随机访问,即可以在O(1)时间内找到第i个元素;静态、动态都是data[i-1]
- 存储密度高,每个节点只存储数据元素
- 扩展容量不方便,静态不能扩展(即便采用动态分配的方式实现,扩展长度的时间复杂度也比较高)
- 插入、删除操作不方便,需要移动大量元素
顺序表小结
顺序表的插入和删除
顺序表的基本操作–插入
代码优化。增强代码的健壮性
插入操作时间复杂度
顺序表的基本操作–删除
删除表中的i个位置,后面的元素都要向一次前移动一个位置,同时长度减一
注意:插入操作时,先移动结尾的元素;删除操作完成后,先移动被删除位置的后一个元素
删除操作时间复杂度
知识点小结
顺序表的基本操作–查找
顺序表的按位查找:获取表L中的第i个位置的元素值
静态
动态
- malloc申请数组空间,返回的是数组的起始地址
- 用某一个类型的指针加上数组下表的这种方式来访问数据的时候,系统在背后取数据的取几个字节和这个指针所指向的类型有关
- 因此malloc申请空间时,返回值一定要强转成对应的类型
时间复杂度:O(1),这也是顺序表的随机存储特性
顺序表按值查找:在表L中查找具有给定关键字的元素
如果是结构类型的数据元素也是这样的么?
- 答案是不能,在C语言中,结构体的比较不能直接用==
- 要自己写代码依次对比各个分量来判断两个结构体
- 如果是C++,可以考虑重载==的运算方式
- 考试时,如果学校考的是《数据结构》,那种考察重点在算法思想,不严格要求语法,手写代码可以用==比较结构体;如果考的是《C语言程序设计》,会对语法要求严一些,不能直接比较结构体
按值查找的时间复杂度
知识点小结
单链表的定义
用代码定义一个单链表
LNode * L 和 LinkList L的使用
- 二者的使用效果是一样的,只不过后者可读性更好一些
- 教材中很多时候二者是同时使用的,有各自的侧重强调点
- 阅读时注意辨识,使用时灵活运用
比如头插法建立单链表
初始化一个不带头结点的单链表
带头结点的单链表
带头结点与不带头结点
知识点小结
单链表的插入和删除
按位序插入–带头结点
按位序插入–不带头结点
指定结点得的后插操作
指定节点的前插操作:
- 单链表无法找到指定结点的前驱,而用遍历的方式时间复杂度又太大,O(n);
- 可以在p后面插入元素s,s保存p的内容,原来的p再新增我们要添加的元素,间接实现前插,时间复杂度O(1)
按位序删除–带头结点
指定结点的删除
偷天换日法,类似于上面的前叉操作
偷天换日法仍然有局限性
- 如果删除的p结点就是最后一个结点,那么p的后继就会没有指向,交换数据的代码就会出现空指针
- 只能从表头开始遍历
- 所以单链表还是挺不方便的
知识点小结
tips
- 这些代码都要会写,都重要
- 打牢基础,慢慢加速
- 体会带头结点,不带头结点的区别
- 体会封装的好处
单链表–查找
代码实现
考虑临界情况
- i=0时,直接返回头结点的指针
- i=8时,返回null
- i=3时,返回a3
平均时间复杂:i取得合法范文内的任何一个数字的概率都等可能的情况下,O(n)
王道书里的代码实现略有不同,p节点一开始指向了第一个节点,后面都一样
封装的好处:避免重复代码,简洁,易于维护
按值查找
回一下,如何比较两个struct是否相等
按值查找平均时间复杂度:需要遍历表,O(n)
求表的长度
求表长平均时间复杂度:需要遍历表,O(n)
知识点小结
单链表–建立
初始化单链表
利用之前封装的按位置插入建立单链表
缺点:每次插入都要遍历,时间复杂度很高,没必要
设置一个表尾指针,实现尾部后插操作
王道书上的尾插法
思考:如果不带头结点,尾插法如何实现
头插法建立单链表:在链表的头部插入数据,每一次的插入其实就是对头结点的后插操作
课本里的代码
注意:初始化链表为null的操作必须有,否则容易指向脏数据
头插法建立单链表还可用于链表的逆置
知识点小结
双链表
单链表与双链表
双链表的初始化–带头结点
双链表的插入
搞定了后插操作,那么按位插入或一个节点的前插操作都容易实现
- 按位插入:遍历找到目标节点的前驱节点,对前驱节点执行后插操作
- 一个节点的前插:找到该节点的前驱节点,对这个前驱节点执行后插操作
双链表的删除 - 注意空指针情况的判断
- 销毁一个链表,只需不断地删除头结点后面的节点,直至头结点后再无节点
双链表的遍历
知识点小结
循环链表
初始化循环单链表
单链表与循环单链表
循环双链表
循环双链表的初始化
循环双链表的初始化
双链表的插入
在尾节点后插入不会出现null,因为有指向
循环双链表的删除
知识点小结
静态链表
什么是静态链表
- 分配一段连续空间,每个节点用于存储数据和下一个节点的游标
- 与链表指针区别在于,链表指针存储的是物理地址,这里的游标存储的是下一个节点的编号
- 头结点默认游标为0,往后每个节点的游标依次加1
- 这些节点可能是按照物理地址依次连接的,也可能不是,但是整个一段空间是连续的
- 字面意思,也可以理解为静态数组和链表的结合体
代码定义静态链表
王道书定义静态链表 - 这种定义方式比较少见,但是也要了解
对比两种方法定义静态链表
静态链表基本操作 - 考试很少考察代码
知识点小结
顺序表 VS 链表
逻辑结构:都是线性结构
存储结构
基本操作:创销,增删改查
销毁
- 顺序表
- 静态分配:系统自动回收
- 动态数组:malloc分配的内存在堆区,堆区不能系统自动回收,需要手动free
- 链表:依次删除各个节点free
增删 - 二者的最坏时间复杂度都是O(n)
- 还是链表的综合效率更高;因为移动数据元素对于顺序表可能代价很大,而查找元素对于链表来说代价比较低
查找:顺序表效率更高
如何选择要看生产中使用的侧重点
知识点小结
小不要着急看第三章,先做王道题!