[数据库架构设计]关系型数据库的内存数据模型(CauchyDB 系列I)

最新推荐文章于 2024-09-14 10:04:22 发布

原创

最新推荐文章于 2024-09-14 10:04:22 发布 · 810 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#数据库 #抽象 #缓存 #C++ #IO

关于CauchyDB

这次我们介绍的主角，是我最近开始编写的CauchyDB,鉴于我还没有完成它的开发（因为考试周的原因……），所以暂时没有放到GitHub上。这个系列的文章，主要就CauchyDB的设计架构进行一系列的讨论，如有不足之处，欢迎大家指出，谢谢。

前言

硬盘数据库与内存数据库

这两种数据库看起来差别很大，不过实际上差距已经越来越小，硬盘数据库也有强有力的内存Buffer，内存数据库也有各种可持久化手段，CauchyDB基于硬盘数据库的理念开发，并且提供精简高效的Buffer来提高效率。

Buffer的读策略

由于是硬盘数据库，Buffer采用延迟载入的手段，在每一次载入时，可以读一整个Block（这样会提高效率，因为硬盘的基本读写单位就是Block），获取数据时，一定从Buffer获取，如果Buffer没有就载入Buffer，如果Buffer满了，那就采取Pop的策略（这里可以有很多算法，比如维护一个堆，或者采取频率统计的方法管理Buffer，当然也可以做成可扩展性的维护策略，有利于后期修改。

Buffer的写策略

Buffer的写策略主要有两种，写透（每次都同步到硬盘）和贪婪（定时同步到硬盘），贪婪策略主要用于对可持久化要求不高的内存数据库，当然硬盘数据库也可以使用，同时更可以配合日志提高稳健性，写透策略效率会略低，不过对于高读少写的数据库来说，还是可以接受的。

数据抽象

抽象是Programming的essence，有了良好的数据抽象不但利于编码，更利于维护，还能提高效率。我认为，架构是软件的灵魂，设计一个好的架构远比写出大量代码重要的多。首先实现代码功能是不可取的，这样在后续的开发过程中只能举步维艰。
软件开发，就像是攻城略地，写出功能如同攻下一城，通过测试如同守下一城，患得患失只会让人丧失未来的机会，真正的军事战略家应在站在全局的层面，把握宏观战略，而软件的架构则同理。