mongodb 索引原理
什么是索引
索引就是将文档按某个(或某些字段)顺序组织起来,以达到根据该字段高效查询的目的。
为什么要使用索引
索引索引的好处:
- 高效查询,降低服务器开销
- 更新/删除操作时,能够快速定位文档
- 快速排序
mongodb 索引类型
单字段索引
db.user.ensureIndex({"age": 1})
对于单字段索引来说,索引的顺序(正序或倒序)是一样的。
复合索引
db.user.ensureIndex({"name":1, "age": -1})
建立原则:
- 取值范围较多的字段,在建立索引时放在前面
复合索引中字段的升序或降序,影响排序是否能使用索引。
在此例中,以下方式的排序会用到索引:
sort({"name":1, "age":-1})
sort({"name":-1, "age":1})
以下排序不会用到索引:
sort({"name":1, "age":1})
sort({"name":-1, "age":-1})
// 可通过建立 {"name":1, "age": 1} 或 {"name":-1, "age":-1} 索引来让这种排序能使用到索引
多 key 索引
当索引字段为数组时,创建出来的索引为多 key 索引。
其他类型索引
- 哈希索引(Hashed Index):是指按照某个字段的hash值来建立索引,目前主要用于MongoDB Sharded Cluster的Hash分片,hash索引只能满足字段完全匹配的查询,不能满足范围查询等。
- 地理位置索引(Geospatial Index):能很好的解决O2O的应用场景,比如『查找附近的美食』、『查找某个区域内的车站』等。
- 文本索引(Text Index):能解决快速文本查找的需求,比如有一个博客文章集合,需要根据博客的内容来快速查找,则可以针对博客内容建立文本索引。
索引的额外属性
- 唯一索引 (unique index):保证索引对应的字段不会出现相同的值,比如_id索引就是唯一索引
- TTL 索引:可以针对某个时间字段,指定文档的过期时间(经过指定时间后过期 或 在某个时间点过期)
- 部分索引 (partial index):只针对符合某个特定条件的文档建立索引,3.2版本才支持该特性
- 稀疏索引(sparse index):只针对存在索引字段的文档建立索引,可看做是部分索引的一种特殊情况
Tips:
- 建索引要在后台运行:在对一个集合创建索引时,该集合所在的数据库将不接受其他读写操作。对数据量的集合建索引,建议使用后台运行选项 {background: true}
- 建立索引时,范围筛选可以尝试放在排序字段之后
$exists
,$not
,$ne
,$nin
等操作符比较低效,很可能会导致全表扫描,应尽量避免- 单字段查询,
in
的效率要比or
高 - mongodb 在一次查询中只能使用一个索引,但 or 查询是个例外,or 可以对每个子句都使用索引,因为 or 查询实际上是将两次查询的结果合并,然后去除重复的文档
- explain(‘executionStats’) 后要注意使用的索引,以及优化
nReturned
,totalKeysExamined
,totalDocsExamined
这 3 个字段的内容