文章目录
标签: 数据库
分布式数据库
基本定义
- 分布式数据库=数据库+计算机网络
- 定义:D-DBS是一个数据集合,这些数据,分布在计算机网络的不同计算机上,网络中每个结点具有独立处理的能力,可以执行局部应用,同时每个结点也能通过网络通讯支持全局应用。
- 分布式数据库强调场地自治性(局部应用)以及自治场地之间的协作性(全局应用):“在自治的结点之间协同工作”
基本特性
- 分布性:分布在不同场地上
- 逻辑整体性:数据逻辑上是相互联系的一个整体
数据在分布式数据库的存储途径有
- 复制:系统维护管理的几个完全相同的副本,这些副本分布在不同的结点上
- 分片:关系被划分为几个片段,各个片段存储在不同的结点上
- 复制+分片:关系被划分为几个片段,系统为每个片段维护几个副本
数据分片的四种方式
好处:将关系分片,有利于按用户需求组织数据的分布
- 水平分片
- 将关系r按行分为若干子集r1,r2等,每个子集称为一个水平片段
- 一个水平片段可以看成关系上的一个选择
- 关系的重构可以通过并运算来实现
- 垂直分片
- 将关系r按列分为若干子集r1,r2等,每个子集成为一个垂直片段
- 一个垂直片段可以看成关系上的一个投影
- 关系的重构可以通过连接运算来实现
- 导出分片:导出水平分片,分片的条件不是关系本身属性条件,而是其他关系的属性条件
- 混合分片