大数据、数据仓库与商业智能系统:技术与应用解析
1. 云计算与数据库访问
云计算让数据库访问变得极为便捷。在进行数据库查询时,我们会发现,无论数据库是位于本地桌面计算机还是本地数据库服务器,操作体验并无二致。这充分体现了在“云端”搭建计算资源的简易性,也预示着云计算的应用将愈发广泛。
2. 大数据与非关系型数据库运动
传统上,我们常使用关系数据库模型和 SQL 进行数据处理。然而,如今出现了另一种思潮,即最初被称为 NoSQL 运动,现在更多被称为“不仅仅是 SQL”运动。与该运动相关的大多数(并非全部)数据库管理系统(DBMS)是非关系型的,常被称为结构化存储。
NoSQL DBMS 通常是分布式、复制的数据库,适用于需要支持大型数据集的场景。例如,Facebook 和 Twitter 都采用了 Apache 软件基金会的 Cassandra 数据库。此外,还有基于 XML 文档结构进行数据存储的 NoSQL 数据库实现方式,如开源的 dbXML,它通常支持 W3C 的 XQuery 和 XPath 标准。
3. 结构化存储
结构化存储的发展源于 Amazon.com 的 Dynamo 和 Google 的 Bigtable 这两种存储机制。Facebook 最初开发了 Cassandra,随后在 2008 年将其交由开源开发社区,如今它已成为 Apache 软件基金会的项目。
结构化存储系统与关系型数据库管理系统(RDBMS)的表结构差异显著。其最小存储单元是列,相当于 RDBMS 表中的单元格,由列名、列值和时间戳组成。列可以组合成超级列,多个列和超级列进一步形成列族,列族类似于 RDB
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



