分布式与并行数据库系统技术解析
1 分布式数据库系统概述
1.1 分布式数据库系统的定义与特点
在当今的计算环境中,计算机通过互联网连接形成了全球分布式系统。组织拥有地理上分布且相互连接的数据中心,每个数据中心有数百或数千台计算机通过高速网络相连,构成了分布式和并行系统的混合体。在这样的环境下,数据量急剧增加,人们希望对这些广泛分布的数据进行管理,这就是分布式和并行数据库系统的范畴。
分布式数据库是位于分布式系统节点上的多个逻辑相关数据库的集合。分布式数据库管理系统(Distributed DBMS)是允许管理分布式数据库并对用户隐藏数据分布的软件系统。其重要特征是数据逻辑相关且存储在分布式系统中。
分布式计算系统由多个相互连接的自治处理元素(PE)组成,这些PE的能力可能不同,相互连接方式也不同,且它们只能通过交换消息来了解彼此状态,这会产生通信成本。因此,分布式DBMS在逻辑上集成但物理上分布,它为用户提供统一数据库的视图,而底层数据是物理分布的。
分布式DBMS通常有地理分布式(geo - distributed)和单位置(single location)两种类型。地理分布式的站点通过广域网连接,消息延迟长、错误率高;单位置的PE位置接近,消息交换快、延迟短甚至可忽略,错误率低,这种单位置分布式DBMS通常是数据中心的计算机集群,也称为并行DBMS。
1.2 分布式数据库系统的历史发展
在20世纪60年代数据库系统出现之前,每个应用程序定义和维护自己的数据,导致数据冗余且程序员管理数据的开销大。数据库系统允许数据集中定义和管理,实现了数据独立性,减少了数据冗余。
分布
超级会员免费看
订阅专栏 解锁全文
1906

被折叠的 条评论
为什么被折叠?



