contents
顺序表
数据类型
类型决定在计算机内存中占多少个储存单元
计算机的内存是一个连续的存储空间,把一个字节作为一个基本的存储单元,一个字节八位整体有一个地址标识(最小表示单位是字节),通过地址标识能一下提取八位。如一个整型数据1,先转换成二进制一个字节八位即为00000001,在32位操作系统中整型要占4个字节,如下图所示。
类型决定计算机拿到二进制数据的时候,如何处理
如上图所示,可以将这四个字节当做整数对待,也可将其分开当成四个字符对待,取决于这是哪种类型的数据。
顺序表的基本形式
下图a为顺序表的基本形式,数据元素本身连续存储,每个元素(基本类型相同)所占的存储单元大小固定相同,元素的下标是其逻辑地址,而元素存储的物理地址(实际内存地址)可以通过存储区的起始地址
L
o
c
(
e
0
)
Loc (e_0)
Loc(e0)加上逻辑地址(第
i
i
i个元素)与存储单元大小(
c
c
c)的乘积计算而得,即:
L
o
c
(
e
i
)
=
L
o
c
(
e
0
)
+
c
×
i
Loc(e_i) = Loc(e_0) + c\times i
Loc(ei)=Loc(e0)+c×i
若元素的大小不统一,则须采用图b的元素外置的形式(也称对实际数据的索引),将实际数据元素另行存储,而顺序表中各单元位置保存对应元素的地址信息(即链接)。由于每个链接所需的存储量相同,通过上述公式,可以计算出元素链接的存储位置,而后顺着链接找到实际存储的数据元素。
顺序表的结构
一个顺序表的完整信息包括两部分——表头信息和数据区。
数据区是表中的元素集合,表头信息是为实现正确操作而需记录的信息,即有关表的整体情况的信息,这部分信息主要包括元素存储区的容量和当前表中已有的元素个数两项。
顺序表的两种基本实现方式
实现方法 | 一体式结构 | 分离式结构 |
---|---|---|
说明 | 存储表信息的单元与元素存储区以连续的方式安排在一块存储区里,形成一个完整的顺序表对象。创建后,元素存储区固定。 | 表对象里只即容量和元素个数,实际数据元素存放在另一个独立的元素存储区里 |
地址 | 指向表头容量 | 指向表头容量 |
数据读取 | 跳过表头信息,直接指向数据内容 | 指向表容量,需要通过链接访问 |
元素存储区替换 | 只能整体搬迁,即整个顺序表对象(指存储顺序表的结构信息的区域)改变,顺序表地址则也改变 | 只需将表信息区中的数据区链接地址更新即可,而该顺序表对象不变。顺序地址(即表头起始地址)不变。 |
动态顺序表
采用分离式结构的顺序表,若将数据区更换为存储空间更大的区域,则可以在不改变表对象的前提下对其数据存储区进行扩充,所有使用这个表的地方都不必修改。
只要程序的运行环境(计算机系统)还有空闲存储,这种表结构就不会因为满了而导致操作无法进行。把采用这种技术实现的顺序表称为动态顺序表,因为其容量可以在使用中动态变化。
扩充策略 | 示例 | 特点 |
---|---|---|
每次扩充增加固定数目的存储位置,亦称为线性增长 | 如每次扩充增加10个元素位置 | 节省空间,但是扩充操作频繁,操作次数多。 |
每次扩充容量加倍 | 如每次扩充增加一倍存储空间。 | 减少了扩充操作的执行次数,但可能会浪费空间资源。以空间换时间,推荐的方式。 |
顺序表的操作
增加元素
如图所示,为顺序表增加新元素111的三种方式:
删除元素
Python中的顺序表
Python中的list和tuple两种类型采用了顺序表的实现技术。tuple是不可变类型,即不变的顺序表,因此不支持改变其内部状态的任何操作,而其他方面,则与list的性质类似。
list的基本实现技术
Python标准类型list就是一种动态顺序表,可以加入和删除元素,并在各种操作中维持已有元素的顺序(即保序,从而用list.append(x) 或 list.insert(len(list), x)即尾部插入,比在指定位置插入元素效率高)。list还具有以下行为特征:
特征 | 要求 |
---|---|
基于下标(位置)的高效元素访问和更新,时间复杂度为O(1) | 应该采用顺序表技术,表中元素的链接(即需要元素外置)保存在一块连续的存储区中。 |
允许任意加入元素,且在不断加入元素的过程中,表对象的标识(函数id得到的值)不变 | 必须能更换元素存储区,并且为保证更换存储区时list对象的标识id不变,只能采用分离式实现技术。 |
list存储区扩充策略
- 在建立空表(或者很小的表)时,系统分配一块能容纳8个元素(4个字节,就是一个链接的量)的存储区
- 在执行插入操作(insert或append)时,如果元素存储区满就换一块4倍大的存储区。
- 但如果此时的表已经很大(目前的阀值为50000),则改变策略,采用加一倍的方法。避免出现过多空闲的存储位置。