可扩展记录存储系统:原理与应用
1. 可扩展记录存储系统概述
可扩展记录存储系统是类似于谷歌 BigTable 系统的数据库系统。这些数据库以表格作为基本数据结构,同时具备高度灵活的列管理功能。它们引入了列族的概念,列族就像容器一样,用于存放列的子集。这类系统也被称为表格数据存储、列式数据存储、宽列存储或列族存储。为避免与其他类型的列存储混淆,这里统一使用更通用的“可扩展记录存储”这一名称。虽然可扩展记录存储复用了关系数据模型的一些术语,但它也类似于键值存储,因为它将唯一的多维键映射到一个值。
2. 逻辑数据模型
可扩展记录存储摒弃了关系数据库管理系统(RDBMS)中严格的规范化范式。为了实现更好的查询局部性和更高效的查询执行,它允许一定程度的数据重复。在关系模型中,设计围绕实体展开,之后通过规范化来减少表中的异常;而对于可扩展记录存储,首先需要确定典型的查询工作负载,并据此对数据进行建模。
以图书馆示例来说,假设有三个表:
| 表名 | BookID | Title | Author |
| ---- | ---- | ---- | ---- |
| Book | 1002 | Databases | Miller |
| | 1004 | Algorithms | Jacobs |
| | 1006 | Programming | Brown |
| | 1008 | SQL | Smith |
| 表名 | ReaderID | Name |
|---|
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



