分布式数据库管理系统:数据交付、特性与优势解析
1. 分布式数据管理的背景与发展
在当今数字化时代,数据分布广泛且来源多样,甚至部分数据存在于难以直接访问的“暗网”。因此,分布式数据管理致力于以有意义的方式访问这些数据。这一发展推动了自分布式数据库研究初期就存在的一个研究方向——数据库集成。最初,该研究聚焦于访问不同数据库中的数据,出现了联邦数据库和多数据库等概念。随着网络数据的兴起,研究重点转向不同数据类型的虚拟集成,“数据集成”这一术语变得更为流行。如今,“数据湖”的概念备受关注,它意味着将所有数据逻辑上存储在一个单一存储中,为每个应用提取相关数据。
近十年来,云计算的出现是一个重大发展。云计算是一种计算模式,多个服务提供商提供共享且地理分布的计算资源,用户可根据自身需求租赁这些资源。客户可以租赁基本的计算基础设施,在其上开发自己的软件,选择操作系统并创建虚拟机(VMs)来构建工作环境,这就是所谓的基础设施即服务(IaaS)模式。更高级的云计算环境是除了基本基础设施外,还租赁完整的计算平台,即平台即服务(PaaS),客户可在其上开发自己的软件。最复杂的模式是服务提供商提供特定软件供客户租赁,即软件即服务(SaaS)。目前,在云计算中提供分布式数据库管理服务已成为一种趋势。
2. 分布式数据库的数据交付方式
2.1 交付维度
在分布式数据库中,数据在不同站点之间交付,包括从服务器站点到客户端站点以响应查询,或在多个服务器之间传输。数据交付方式可从三个正交维度进行特征化:交付模式、频率和通信方法,这些维度的不同组合提供了丰富的设计空间。
2.2 交付模式
- 拉
超级会员免费看
订阅专栏 解锁全文
11万+

被折叠的 条评论
为什么被折叠?



