分布式数据库管理系统解析
1. 分布式数据库成本与数据复制
分布式数据库在运行过程中涉及多种成本,包括性能成本、软件开销以及与同步事务及其组件相关的管理成本。不过,数据复制带来的容错优势在一定程度上能平衡这些成本。
当远程数据的使用频率较高且数据库规模较大时,数据复制能够降低数据请求成本。数据复制信息存储在分布式数据目录(DDC)中,事务处理器(TP)会依据DDC的内容来决定访问数据库片段的副本。此外,数据复制还具备恢复丢失数据的能力。
2. 数据分配策略
数据分配是指决定数据存储位置的过程,常见的数据分配策略如下:
- 集中式数据分配 :整个数据库存储在一个站点,也被称为集中式数据库。
- 分区式数据分配 :将数据库划分为两个或更多不相交的部分(片段),并存储在两个或更多站点。
- 复制式数据分配 :一个或多个数据库片段的副本存储在多个站点。
数据在计算机网络上的分布可以通过数据分区、数据复制或两者结合来实现。数据分配与数据库的划分或分段方式密切相关,大多数数据分配研究主要关注一个问题:将哪些数据存储在何处。
数据分配算法会考虑多种因素,具体如下:
- 性能和数据可用性目标
- 实体的大小、行数以及与其他实体的关系数量
- 应用于数据库的事务类型以及每个事务访问的属性
- 移动用户的离线操作
在某些情况下,对于移动用户的数据设计可以考虑使用松散连接的片段,特别是对于不需要频繁更新的只读数据,其副本更新窗口可以更长。
超级会员免费看
订阅专栏 解锁全文
1390

被折叠的 条评论
为什么被折叠?



