在2015/3/17以前,MongoDB只有一个存储引擎,叫做MMAP,MongoDB3.0的推出使得MongoDB有了两个引擎:MMAPv1和WiredTiger。
- MMAPv1:适应于所有MongoDB版本,MongoDB3.0的默认引擎
- WiredTiger:仅支持64位MongoDB
MongoDB两种引擎可以互相切换,我们可以在创建服务的时候指定引擎类型。语句如下:
MMAPv1
sc.exe create MongoDB binPath= "\"E:\Program Files\MongoDB\Server\3.0\bin\mongod.exe\" --service --directoryperdb --config=\"E:\Program Files\MongoDB\Server\3.0\mongod.cfg\"" DisplayName= "MongoDB" start= "auto"
WiredTiger
sc.exe create MongoDB binPath= "\"E:\Program Files\MongoDB\Server\3.0\bin\mongod.exe\" --service --directoryperdb --storageEngine=wiredTiger --config=\"E:\Program Files\MongoDB\Server\3.0\mongod.cfg\"" DisplayName= "MongoDB" start= "auto"
MMAPv1预分配策略
MongoDB为了保证连续的存储空间,避免磁盘碎片问题会预分配空间。
工作方式是这样的:在创建数据库时,系统会创建一个名为[dbName].0的文件,该文件固定大小为64M,当该文件有一半以上被使用时,系统会再创建一个名为[dbName].1的文件,该文件大小是方才的两倍。以此类推,接下来创建的[db Name].n都是[dbName].n-1的两倍,最大直到2048M,此后,再次创建的文件大小都为2048M。因此如果数据足够多,64M, 128M, 256M, 1024M, 2048M, 2048M…大小的文件会被创建。下图为数据库中的数据文件。
MongoDB记录数及占用空间测试
以下是不同记录数的情况下数据占用空间大小,每个文档的大小为240B,本人亲测:
记录数 | 占用磁盘空间 |
---|---|
200万 | 1G |
600万 | 4G |
1500万 | 6G |
5000万 | 20G |
空间释放
MongoDB自己不会释放空间,需要根据实际情况考虑策略。
我们删除MongoDB中的数据后,MongoDB不会释放空间,在此基础上再次插入数据后,数据将占用删除后的空间,即不再需要重新开辟空间。
我们可以采用repair或compact命令主动回收,compact命令是对于某个collection(表),而repair是针对一个数据库。repaire命令执行时会停止数据库读写操作。(目前使用repair命令可实现空间释放,但是compact命令执行之后没有效果,需要再研究)。
WiredTiger
文档级锁(Document Level Locking)
WiredTiger增加了文档级锁的概念,想比于MMAP的集合级锁,文档级锁可以让多个客户端同时修改同一个集合中的不同数据。
压缩(Compression)
使用WiredTiger引擎,MongoDB可以压缩所有的集合和索引,相对于MMAPv1,MongoDB可以压缩最大80%的空间。
下图可以看出WiredTiger在存储方面的优势:
引擎 | 记录数 | 磁盘空间 | 数据大小 | 每个文档大小 | 索引大小 | 数据占用空间 |
---|---|---|---|---|---|---|
MMAP | 400万 | 1.95G | 915M | 240B | 127M | 1111M |
WiredTiger | 400万 | 103M | 515M | 135B | 34M | 68M |
注:以上数据为本人测试结果,不同的文档会有不同的结果,大家可以自己试下。
http://blog.youkuaiyun.com/liwanqing1990/article/details/45980223