关于CauchyDB
这次我们介绍的主角,是我最近开始编写的CauchyDB,鉴于我还没有完成它的开发(因为考试周的原因……),所以暂时没有放到GitHub上。这个系列的文章,主要就CauchyDB的设计架构进行一系列的讨论,如有不足之处,欢迎大家指出,谢谢。
前言
硬盘数据库与内存数据库
这两种数据库看起来差别很大,不过实际上差距已经越来越小,硬盘数据库也有强有力的内存Buffer,内存数据库也有各种可持久化手段,CauchyDB基于硬盘数据库的理念开发,并且提供精简高效的Buffer来提高效率。
Buffer的读策略
由于是硬盘数据库,Buffer采用延迟载入的手段,在每一次载入时,可以读一整个Block(这样会提高效率,因为硬盘的基本读写单位就是Block),获取数据时,一定从Buffer获取,如果Buffer没有就载入Buffer,如果Buffer满了,那就采取Pop的策略(这里可以有很多算法,比如维护一个堆,或者采取频率统计的方法管理Buffer,当然也可以做成可扩展性的维护策略,有利于后期修改。
Buffer的写策略
Buffer的写策略主要有两种,写透(每次都同步到硬盘)和贪婪(定时同步到硬盘),贪婪策略主要用于对可持久化要求不高的内存数据库,当然硬盘数据库也可以使用,同时更可以配合日志提高稳健性,写透策略效率会略低,不过对于高读少写的数据库来说,还是可以接受的。
数据抽象
抽象是Programming的essence,有了良好的数据抽象不但利于编码,更利于维护,还能提高效率。我认为,架构是软件的灵魂,设计一个好的架构远比写出大量代码重要的多。首先实现代码功能是不可取的,这样在后续的开发过程中只能举步维艰。
软件开发,就像是攻城略地,写出功能如同攻下一城,通过测试如同守下一城,患得患失只会让人丧失未来的机会,真正的军事战略家应在站在全局的层面,把握宏观战略,而软件的架构则同理。

最低0.47元/天 解锁文章
795





