可扩展分布式数据库基础:从关系型到 NoSQL 的演变
1. 数据库市场的变迁
在 21 世纪初,数据库领域相对平静且简单,绝大多数应用都基于关系型数据库技术构建。当时主要厂商的几款关系型数据库占据主导地位,至今在数据库市场份额排名前十的位置仍占据大部分。若回到 2001 年查看类似排名,如今排名前十中的约 7 款关系型数据库位置变化不大。但到 2022 年,排名前 20 的数据库引擎中,至少有 10 款在 20 年前并不存在,且大多是非关系型数据库,这表明数据库市场已不断扩张和多元化。
2. 分布式数据库的兴起
如今的数据系统规模远超 20 年前,那时关系型数据库占据主导。互联网规模的应用推动了数据集规模和复杂性的增长,这些应用为数千万用户创建和管理海量异构数据,如用户资料、偏好、行为数据、图像视频、销售数据等,许多数据集大到无法在单台机器上存储。
这促使数据库引擎不断发展以管理分布式数据。新一代关系型和非关系型数据库平台应运而生,具备各种不同的能力以满足不同的用例和可扩展性需求。同时,低成本、高性能硬件的发展使得数据能够经济高效地分布在数百甚至数千个节点和磁盘上,既提高了可扩展性,又通过数据复制增强了可用性。
此外,如今互联网应用需求的变化也是数据库引擎创新的重要驱动力。关系型数据库的事务和一致性优势在某些场景下会带来性能成本,例如 Twitter 和 Facebook 等网站,并非要求每个用户都能实时看到相同版本的内容。对于拥有大量用户的应用,可以放宽关系型数据库的数据约束,以获得更高的性能和可扩展性,这也催生了新的非关系型数据模型和原生分布式数据库引擎。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



