分布式数据库:数据复制、查询处理与并发控制
1. 数据复制策略
数据复制是指在多个站点上存在相同的数据副本,这实际上引入了一定程度的冗余。采用数据复制策略主要有两个重要原因:
- 数据可在请求信息的站点或其附近站点获取,从而减少数据传输需求。
- 提高整体数据可用性,若某个站点出现故障,可从其他站点获取相同数据的副本。
数据复制有以下三种方式:
1.1 全复制数据库
在全复制数据库环境中,所有站点都包含完整的数据库。每个数据元素在每个站点都可获取,这极大地提高了数据可用性和容错能力。几乎所有查询都可在本地执行,无需从其他站点检索数据,查询执行性能较高。然而,这种方案也存在明显缺点,整体性能(包括更新操作)较差。因为当用户在一个站点更新数据库时,必须将这些更改复制到所有其他站点以维护数据的完整性和一致性,而且并发控制和数据恢复也较难实现。
1.2 部分复制数据库
在部分复制数据库环境中,部分数据库或表在部分站点进行复制。并非每个数据库元素都存在于每个站点,具体复制哪些数据库、如何复制以及在哪些站点复制,需根据具体环境决定。一般来说,应复制查看频率高于更新频率的数据库,这样可在不过多增加开销的情况下提供更好的性能。
1.3 无复制
在无复制环境中,数据元素仅存储在一个位置。这与全复制相反,不存在更新开销,但由于只有一份数据副本,数据可用性不高。若包含特定数据元素的站点出现故障,用户请求该数据时需等待。此外,由于查询无法在本地执行,数据传输需求较高,分布式数据库管理系统(DDBMS)必须先从相关站点获取数据才能执行查询。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



