前几天总结了mongodb的安装入门、详细解释了增删改查的基本操作,今天再来总结下mongodb更高级的操作,聚合和游标。
一、聚合,mongodb的聚合操作一般分为四种情景,分别是:count、distinct、group、mapReduce
1、count
count最简单,最容易,也是我们最常用的聚合工具,话说最常用的大家都会用,所以对大家都不是问题,所以叫最简单~~
count
db.person.find()
db.person.count()
db.person.count({"age":40})
2、distinct
顾名思义,指定了谁,谁就不能重合。
db.person.distinct("age")
3、group
group的操作有些小复杂,但是越是复杂的操作,应用起来就越灵活,group的操作本质上相当于一种“key-value”模型。
下面举的例子就是按照age进行group操作,value为对应age的姓名。下面对这些参数介绍一下:
key: 这个就是分组的key,我们这里是对年龄分组。
initial: 每组都分享一个”初始化函数“,特别注意:是每一组,比如这个的age=10的value的list分享一个initial函数,age=40同样也分享一个initial函数。
$reduce: 这个函数的第一个参数是当前的文档对象,第二个参数是上一次function操作的累计对象,第一次为initial中的{”perosn“:[]}。有多少个文档,
$reduce就会调用多少次。
group
db.person.group({
"key":{"age":true},
"initial":{"person":[]},
"$reduce":function(cur,prev){
prev.person.push(cur.name);
}
})
上面的结果,有时候我们还可能会有其他的需求,例如:
1、过滤掉age<26岁的成员。
2、有时候person的成员太多,我不可能一一查看,所以我想count一下,这样看起来也比较方便。
这在group是非常容易办到的,因为mongodb有两个可选参数:condition 和finalize
condition 是个过滤条件
finalize 是一个方法,每个文章执行完后,都会触发它,可以在这个方法里面加入count。
condition 和 finalize
db.person.group({
"key":{"age":true},
"initial":{"person":[]},
"$reduce":function(cur,prev){
prev.person.push(cur.name);
},
"finalize":function(count){
out.count=out.person.length;
},
"condition":{"age":{$gte:10}}
})
4、 mapReduce
mapReduce其实是一种编程模型,用在分布式计算中,其中有一个“map”函数,一个”reduce“函数。
1、map:
这个称为映射函数,里面会调用emit(key,value),集合会按照你指定的key进行映射分组。
2、reduce:
这个称为简化函数,会对map分组后的数据进行分组简化,注意:在reduce(key,value)中的key就是
emit中的key,vlaue为emit分组后的emit(value)的集合,这里也就是很多{"count":1}的数组。
3、mapReduce:
这个就是最后执行的函数了,参数为map,reduce和一些可选参数。具体看图可知:
mapReduce
map
function(){
emit(this.name,{count:1});
}
reduce
function(key,value){
var result={count:0};
for(var i=0;i<value.length;i++){
result.count += value[i].count;
}
return result;
}
db.person.mapReduce(map,reduce,{"out":"collection"})
{
"result":"collection",
"timeMillis":15,
"counts":{
"input":7,
"emit":7,
"reduce":3,
"output":4
},
"ok":1,
}
从图中我们可以看到如下信息:
result: "存放的集合名“;
input:传入文档的个数。
emit:此函数被调用的次数。
reduce:此函数被调用的次数。
output:最后返回文档的个数。
二、游标
mongodb里面的游标有点类似我们说的C#里面延迟执行,比如:
var list=db.person.find();
针对这样的操作,list其实并没有获取到person中的文档,而是申明一个“查询结构”,等我们需要的时候通过for或者next()一次性加载过来,然后让游标逐行读取,当我们枚举完了之后,游标销毁,之后我们在通过list获取时,发现没有数据返回了。
游标
var list = db.person.find();
list.forEach(function(x){
print(x.name);
})
同时,我们也可以查用分页、排序等查询!
这样可以减少不必要的开销
var single=db.person.find().sort({"name":1}).skip(2).limit(2);
好啦,聚合和游标基本就这些,如果有不对的地方敬请指正。
原创文章,转载请注明出处:http://blog.youkuaiyun.com/jessonlv
下期会写关于mongodb索引的建立等操作