k - QTPT:自主分布式数据库系统的动态查询优化新方案
在当今的商业环境中,数据常常分布在组织内的多个站点,由多个数据库管理系统进行管理,以满足可扩展性、性能、访问和管理等多方面的需求。分布式数据库系统应运而生,它可以看作是多个独立协作的数据库系统的集合。
1. 分布式数据库系统基础
分布式数据库系统可分为同构和异构系统。同构分布式数据库管理系统(DDBMS)中,不同站点的数据库系统类型相同;而异构系统则在每个站点使用不同类型的数据库。同构 DDBMS 又可进一步分为自主和非自主系统。
- 非自主 DDBMS :有一个中央优化器,它决定查询在哪个节点执行,并且所有节点都了解其他节点的信息。
- 自主 DDBMS :没有中央优化器,节点根据自身的处理能力和当前负载,自主决定是否参与查询执行,且节点之间相互不了解。
分布式查询处理是从网络中的不同站点检索数据的过程,其性能取决于从多个站点访问数据的速度和效率。在分布式查询处理中,一个查询会被分解为多个子查询,并根据数据的分片模式和复制情况分配到不同的站点。
以一个查询“为人力资源部门的员工检索员工和部门详细信息”为例,假设员工关系在站点 1,部门关系在站点 2,查询由站点 3 发起,有以下三种执行方式:
| 方式 | 操作 | 数据传输量 |
| ---- | ---- | ---- |
| a | 将员工和部门关系都传输到结果站点(站点 3)并在站点 3 执行连接操作 | (10,000 * 100) 字节(站点 1) + (100 * 35) 字节(站点 2) = 1003500 字
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



