云与分布式编程技术解析
在当今的计算领域,云平台和分布式编程技术正发挥着越来越重要的作用。下面将详细介绍云平台的一些关键特性以及并行和分布式编程的相关范式。
云平台特性
部署优势
部署能够显著简化系统。对于 N 个平台特性,仅需 N 个服务,而其他方法可能产生多达 2N 个可能的镜像,这显示了部署在简化系统方面的巨大优势。
表格和 NOSQL 非关系型数据库
简化的数据库结构(即“NOSQL”)有了大量重要的发展,这类数据库通常强调分布式和可扩展性。在三大主要云平台中都有体现:Google 的 BigTable、Amazon 的 SimpleDB 和 Azure 的 Azure Table。表格在科学领域很重要,天文学中的 VOTable 标准以及 Excel 的广泛使用就是例证。不过,在云之外使用表格的经验似乎并不多。
非关系型数据库有许多重要用途,特别是在元数据存储和访问的三元组存储方面。最近,人们对基于 MapReduce、表格或 Hadoop 文件系统构建可扩展的 RDF 三元组存储产生了兴趣,并且在大型存储方面已有早期成功案例。当前的云表格可分为两类:Azure Table 和 Amazon SimpleDB 非常相似,支持“文档存储”的轻量级存储;而 BigTable 旨在管理无大小限制的大型分布式数据集。所有这些表格都是无模式的(每个记录可以有不同的属性),不过 BigTable 有列(属性)族模式。对于科学计算而言,表格的重要性可能会增加,学术系统可以借助两个 Apache 项目来支持:用于 BigTable 的 Hbase 和用于文档存储的 CouchDB。另一个选择是开源的 SimpleDB
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



