MongoDB聚合操作

最新推荐文章于 2025-04-20 00:06:48 发布

原创

最新推荐文章于 2025-04-20 00:06:48 发布

· 1.2k 阅读

15 ·

版权

文章标签：

#mongodb #数据库

管道的聚合

管道在Unix和Linux中一般用于将当前命令的输出结果作为下一个命令的参数。

MongoDB的聚合管道将MongoDB文档在一个管道处理完毕后将结果传递给下一个管道处理。管道操作是可以重复的。

表达式：处理输入文档并输出。表达式是无状态的，只能用于计算当前聚合管道的文档，不能处理其它的文档。

这里我们介绍一下聚合框架中常用的几个操作：

$project：修改输入文档的结构。可以用来重命名、增加或删除域，也可以用于创建计算结果以及嵌套文档。
match：用于过滤数据，只输出符合条件的文档。match使用MongoDB的标准查询操作。
$limit：用来限制MongoDB聚合管道返回的文档数。
$skip：在聚合管道中跳过指定数量的文档，并返回余下的文档。
$unwind：将文档中的某一个数组类型字段拆分成多条，每条包含数组中的一个值。
$group：将集合中的文档分组，可用于统计结果。
$sort：将输入文档排序后输出。
$geoNear：输出接近某一地理位置的有序文档。

1、$project实例

db.mycol.aggregate({$project:{name : 1, score : 1}})

这样的话结果中就只还有_id,name和score三个字段了，默认情况下_id字段是被包含的，如果要想不包含_id话可以这样:

db.mycol.aggregate({$project:{_id : 0, name : 1, score : 1}})

2、$match实例

$ma t c h 用于获取分数大于 30 小于并且小于 100 的记录，然后将符合条件的记录送到下一阶段$ group管道操作符进行处理

db.mycol.aggregate([{ $KaTeX parse error: Expected '}', got 'EOF' at end of input: \dotsatch :{score: {$ gt: 30, $KaTeX parse error: Expected 'EOF', got '}' at position 8: lt: 100}̲}},{$ group:{_id:' $KaTeX parse error: Expected '}', got 'EOF' at end of input: sex',count:{$ sum:1}}}])

Aggregation-聚合查询和mysql sql语句对应

Aggregation：

参数说明：sql(Operators)

where ( $ma t c h) 、 g ro u p b y ($ group) 、having( $ma t c h) 、 se l ec t ($ project)、order by( $sor t) 、 l imi t ($ limit) sum( $s u m) 、 co u n t ($ sum)、join($lookup)

SELECT cust_id, SUM(price) as total
FROM orders
WHERE status = 'A'
GROUP BY cust_id
HAVING total > 250

db.orders.aggregate([
    {$match: {status: 'A'}},
    {$group: {_id: "$cust_id",total: { $sum: "$price"}}},
    {$match: {total: { $gt: 250}}}
])

更加字段长度排序

db.collection.aggregate(
    [
        {$project: {
            "field": 1,
            "field_length": { $strLenCP: "$field" }
        }},
        {$sort: {"field_length": -1}},
        {$project: {"field_length": 0}},
    ]
)

聚合统计之$count表达式

普通查询：db.foo.find({name:{$ne:null}}).count()

$count 表达式等价于以下形式的 $sum 表达式：

{ $sum: 1 }

$count 示例

接下来我们将会使用以下集合进行演示：

db.sales.insertMany([
	{ "_id" : 1, "item" : "Americanos", "price" : 5, "size": "Short", "quantity" : 22, "date" : ISODate("2022-01-15T08:00:00Z") },
	{ "_id" : 2, "item" : "Cappuccino", "price" : 6, "size": "Short","quantity" : 12, "date" : ISODate("2022-01-16T09:00:00Z") },
	{ "_id" : 3, "item" : "Lattes", "price" : 15, "size": "Grande","quantity" : 25, "date" : ISODate("2022-01-16T09:05:00Z") },
	{ "_id" : 4, "item" : "Mochas", "price" : 25,"size": "Tall", "quantity" : 11, "date" : ISODate("2022-02-17T08:00:00Z") },
	{ "_id" : 5, "item" : "Americanos", "price" : 10, "size": "Grande","quantity" : 12, "date" : ISODate("2022-02-18T21:06:00Z") },
	{ "_id" : 6, "item" : "Cappuccino", "price" : 7, "size": "Tall","quantity" : 20, "date" : ISODate("2022-02-20T10:07:00Z") },
	{ "_id" : 7, "item" : "Lattes", "price" : 25,"size": "Tall", "quantity" : 30, "date" : ISODate("2022-02-21T10:08:00Z") },
	{ "_id" : 8, "item" : "Americanos", "price" : 10, "size": "Grande","quantity" : 21, "date" : ISODate("2022-02-22T14:09:00Z") },
	{ "_id" : 9, "item" : "Cappuccino", "price" : 10, "size": "Grande","quantity" : 17, "date" : ISODate("2022-02-23T14:09:00Z") },
	{ "_id" : 10, "item" : "Americanos", "price" : 8, "size": "Tall","quantity" : 15, "date" : ISODate("2022-02-25T14:09:00Z")}
]);

示例一：分组统计文档的数量

以下示例使用 $count 表达式计算不同种类咖啡的数量：

db.sales.aggregate([
  {
    $group: {
      _id: '$item',
      itemCount: { $count: {} },
    },
  },
])

返回结果如下：

[
  { _id: 'Mochas', itemCount: 1 },
  { _id: 'Americanos', itemCount: 4 },
  { _id: 'Lattes', itemCount: 2 },
  { _id: 'Cappuccino', itemCount: 3 }
]

其中，

_id: “$item” 用于将文档按照 item 字段进行分组，返回 4 个组；
$count: {} 用于统计每个分组内的文档数据，并将结果赋予 itemCount 字段。

示例二：统计与过滤

以下示例使用 $count 表达式计算不同种类咖啡的数量，并且返回数量大于 2 的结果：

db.sales.aggregate([
  {
    $group: {
      _id: '$item',
      itemCount: { $count: {} },
    },
  },
  {
    $match: { itemCount: { $gt: 2 } },
  },
]);

返回结果如下：

[
  { _id: 'Americanos', itemCount: 4 },
  { _id: 'Cappuccino', itemCount: 3 }
]