MongoDB 聚合
MongoDB中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果。有点类似sql语句中的 count(*)。
管道的概念
管道在Unix和Linux中一般用于将当前命令的输出结果作为下一个命令的参数。
MongoDB的聚合管道将MongoDB文档在一个管道处理完毕后将结果传递给下一个管道处理。管道操作是可以重复的。
表达式:处理输入文档并输出。表达式是无状态的,只能用于计算当前聚合管道的文档,不能处理其它的文档。
这里我们介绍一下聚合框架中常用的几个操作:
● $project:修改输入文档的结构。可以用来重命名、增加或删除域,也可以用于创建计算结果以及嵌套文档。
● $match:用于过滤数据,只输出符合条件的文档。$match使用MongoDB的标准查询操作。
● $limit:用来限制MongoDB聚合管道返回的文档数。
● $skip:在聚合管道中跳过指定数量的文档,并返回余下的文档。
● $unwind:将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值。
● $group:将集合中的文档分组,可用于统计结果。
● $sort:将输入文档排序后输出。
● $geoNear:输出接近某一地理位置的有序文档。
创建测试数据
db.test.insert( {
"bind_count" : NumberInt(0),
"date_time" : "2016-06-22",
"net_count" : NumberInt(1),
"qrCode_id" : "5769286100d00d6d4b3f596d",
})
db.test.insert( {
"bind_count" : NumberInt(0),
"date_time" : "2016-06-23",
"net_count" : NumberInt(1),
"qrCode_id" : "5769286100d00d6d4b3f596d",
})
db.test.insert({
"bind_count" : NumberInt(10),
"date_time" : "2016-06-13",
"net_count" : NumberInt(11),
"qrCode_id" : "576a384f00d00d06c5ae3769",
})
使用聚合函数aggregate分组统计
第一种只做统计不做条件筛选
统计qrcode_id字段出现的条数
类似sql select cound(*) from test group by qrCode_id
db.test.aggregate([{$group : {_id : "$qrCode_id", count : {$sum : 1}}}])
统计test表中不同qrcode_id的用户的bind_count总数
类似sql select sum(bind_count) from test group by qrCode_id
db.test.aggregate([{$group : {_id : "$qrCode_id", bindCount : {$sum :"$bind_count"}}}])
第二种按条件统计结合$match使用 不分组
db.test.aggregate([
{$match : { qrCode_id :"576a384f00d00d06c5ae3769"}},
{$group: { _id: null, count: { $sum: "$net_count" }}}
]);
总结:mongodb总统计查询时如果让按某一字段分组统计出现的总条数就是 {$sum : 1}
反之统计某一数字类型字段的总和就是 {$sum : "$filed"}
做条件过滤就要在aggregate增加$match表达式 和普通的条件查找是一样的
是否分组就是控制_id,为null就不分组
下面演示Java操作mongodb使用聚合函数查询 这里操作的事3.2以上的驱动版本3.0以后Java操作mongodb的api有大幅改动
//Java链接mongodb驱动这里就不做演示了,之前有工具类链接如下
http://blog.youkuaiyun.com/u010391342/article/details/52061988
Bson bson=null;
bson=Filters.and(Filters.eq("owner", "tom"),Filters.eq("title", "good day"));
AggregateIterable<Document> iterable = mc.aggregate(Arrays.asList(match(bson),group(null, sum("totalWords", "$words"),sum("totalWords222", "$words"))));
//打印输出
iterable.forEach(new Block<Document>() {
public void apply(final Document document) {
System.out.println(document);
}
});
//加分组字段 可一个多个字段同同时分组 分页查询
/* Group操作 ,同时两个字段分组*/
DBObject groupFileds=new BasicDBObject();
groupFileds.put("qrCode_id", "$qrCode_id");
// groupFileds.put("qrCode_id", "$qrCode_id");//第二个分组字段
DBObject fileds = new BasicDBObject("_id", groupFileds);
fileds.put("count", new BasicDBObject("$sum",1)); //统计每个分组数据重复数量
fileds.put("qrCode_id", new BasicDBObject("$first","$qrCode_id")); //限制显示指定字段
fileds.put("bind_count", newBasicDBObject("$first","$bind_count"));
DBObject group = new BasicDBObject("$group", fileds);
Bson bson=null;
bson=Filters.and(Filters.eq("owner", "tom"),Filters.eq("title", "good day"));
/* 查看Group结果 */
AggregateIterable<Document> iterable =mc.aggregate(Arrays.asList(match(bson),group,
Aggregates.skip(startRow),Aggregates.limit(pageSize)));
iterable.forEach(new Block<Document>(){
public void apply(final Document document) {
System.out.println(document);
}
});