大数据的数据结构与分布式系统解析
1. 循环列车与双链表列车
在大数据处理中,有两种重要的数据结构:用于处理同构数据的 r - 列车(train)和处理异构数据的 r - 阿列车(atrain)。在列车或阿列车中,每节车厢通过链接地址 e 与下一节车厢相连,虽然可以从领航器直接访问所有车厢,但每节车厢也有一个指向紧邻下一节车厢的前向链接。通常,最后一节车厢连接到一个无效地址。
- 循环列车与循环阿列车 :当最后一节车厢连接到第一节车厢时,列车(阿列车)就变成了循环列车(循环阿列车)。
- 双链表列车/阿列车 :链接地址 e 的节点由“前驱”和“后继”两个字段组成。前驱字段包含上一节车厢的地址,后继字段包含下一节车厢的地址。在循环拓扑中,第一节车厢的前驱字段填充最后一节车厢的地址;而在多马马车拓扑中,第一节车厢的前驱字段和最后一节车厢的后继字段都填充无效地址。在双链表列车/阿列车中,除了多马马车拓扑下的第一节车厢不能向后移动、最后一节车厢不能向前移动外,从任何车厢都可以进行前后移动。
2. r - 阿列车的基本操作
在阿列车分布式系统中,对异构数据结构 r - 阿列车的三个基本操作是插入、删除和搜索。假设分布式系统采用多马网络拓扑,链接地址 e 采用双地址系统。
2.1 插入操作
插入操作分为三种类型:
- 插入新车厢 :
1. 确定要插入的车厢的数据类型代码 c,读取 CD - 表,如果代码 c 不存在则扩展 CD - 表。
2
超级会员免费看
订阅专栏 解锁全文

1146

被折叠的 条评论
为什么被折叠?



