分布式数据库管理系统:设计问题与架构解析
一、分布式数据库的基础特性
1.1 并行性
当并行执行的操作符之间不存在依赖关系时,就可以实现并行性。例如,图 1.7 中的两个选择操作符就能够并行执行。这种并行形式极具吸引力,因为处理器之间不会产生干扰。
1.2 可扩展性
在分布式环境中,应对不断增长的数据库规模和更大的工作负载变得更加容易。通常可以通过向网络添加处理和存储能力来实现系统扩展。不过,由于分布带来的开销,可能无法实现“能力”的线性增长,但仍能实现显著的改进。这也是分布式数据库管理系统(DBMS)在集群和云计算的横向扩展架构中备受关注的原因。横向扩展(也称为水平扩展)指的是以松散耦合的方式添加更多服务器(即“横向扩展服务器”),几乎可以实现无限扩展。通过方便地添加新的组件数据库服务器,分布式 DBMS 能够实现横向扩展。
二、分布式 DBMS 的设计问题
2.1 分布式数据库设计
2.1.1 数据放置方式
数据放置有两种基本方式:分区(或非复制)和复制。在分区方案中,数据库被划分为多个不相交的分区,每个分区放置在不同的站点。复制设计又可分为完全复制(也称为完全重复),即整个数据库存储在每个站点;以及部分复制(或部分重复),即数据库的每个分区存储在多个站点,但并非所有站点。
2.1.2 设计问题
两个基本的设计问题是分片和分布。分片是将数据库分离为称为片段的分区;分布则是片段的最优分布。
2.1.3 系统目录
相关的问题是系统目录的设计和管理。在集中式 DBMS 中,目录
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



