在MongoDB数据库中常见的聚合操作有:count,distinct,group,mapReduce。现在将它们一一的记录下来:
一、count操作
这个操作顾名思义就是达到统计的效果啦,用来统计符合某一种查询条件的总数。
1 | /** 统计所有记录的总数 */ |
2 | db.user.count() |
3 |
4 | /** 统计名字为 hanmeimei 的记录数 */ |
5 | db.user.count({ "name" : "hanmeimei" }) |
二、distinct操作
在SQL中这个单词的作用是去除重复的意思,在NoSQL数据库中也可以达到同样的效果。
1 | /** 去除重复的年龄 */ |
2 | db.person.distinct( "age" ) |
三、group操作
在关系型数据库中,group表示的是分租,在noSQL数据库中也是表示同样的意思,但是它的操作会比较麻烦一些。归根到底,group的操作就是形成了一种“k-v”模型。
1 | /** 按照年龄 age 来进行分组 然后将name放在user里面 */ |
2 | |
3 | > db.person.group({ "key" :{ "age" : true }, "initial" :{ "user" :[]}, "$reduce" : function (cur,prev){prev.user.push(cur.name);}}) |
key: 这个就是分组的key,我们这里是对年龄分组。
initial: 每组都分享一个”初始化函数“,特别注意:是每一组,比如这个的age=20的value的list分享一个initial函数,age=22同样也分享一个initial函数。
$reduce: 这个函数的第一个参数是当前的文档对象,第二个参数是上一次function操作的累计对象,第一次为initial中的{”perosn“:[]}。有多少个文档, $reduce就会调用多少次。
1 | /** 按照年龄 age 来进行分组 同时要求年龄大于21岁,并且统计每一组查询出来的记录条数*/ |
2 | > db.person.group({ "key" :{ "age" : true }, "initial" :{ "user" :[]}, "$reduce" : function (cur,prev){prev.user.push(cur.name);}, "finalize" : function (out){out.count=out.user.length}, "condition" :{ "age" :{$gt:21}}}) |
condition: 这个就是过滤条件。
finalize:这是个函数,每一组文档执行完后,多会触发此方法,那么在每组集合里面加上count也就是它的活了。
四、mapReduce操作
mapReduce操作是MongoDB聚合操作中最复杂的操作,同时它也是最灵活。 mapReduce其实是一种编程模型,用在分布式计算中,其中有一个“map”函数,一个”reduce“函数。mapReduce是hadoop的核心之一。
1、 map:
这个称为映射函数,里面会调用emit(key,value),集合会按照你指定的key进行映射分组。
2、 reduce:
这个称为简化函数,会对map分组后的数据进行分组简化,注意:在reduce(key,value)中的key就是 emit中的key,vlaue为emit分组后的emit(value)的集合,这里也就是很多{"count":1}的数组。
3、 mapReduce:
这个就是最后执行的函数了,参数为map,reduce和一些可选参数
1 | /** map 函数 */ |
2 | var map= function (){ emit( this .name,{count:1})} |
3 |
4 | /** reduce 函数 */ |
5 | var reduce = function (key,value){ var result = {count:0}; for ( var i = 0;i<value.length;i++){result.count += value[i].count;} return result} |
6 | |
7 | /** mapReduce 操作 */ |
8 | db.person.mapReduce(map,reduce,{ "out" : "collection" }) |
从图中我们可以看到如下信息:
result: "存放的集合名“;
input:传入文档的个数。
emit:此函数被调用的次数。
reduce:此函数被调用的次数。
output:最后返回文档的个数。
同时我们也可以看看最后根据name分组的结果:
这些都是MongoDB中常用的聚合操作了。