MongoDB对不重复数据分组进行计数

本文介绍了在MongoDB中对不重复数据进行分组计数的三种方法:使用distinct、aggregate函数以及结合Python的集合操作。通过示例展示了如何找出特定评分范围内的电影并进行去重计数,强调了在大规模数据中distinct的限制,推荐使用aggregate进行高效分组计数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在实际环境中,经常会用到对数据进行去重计数
1、采用mongodb的distinct
db.collection.distinct("key").length

db 是数据库名称,collection是集合名称,key是去重的字段,根据自己的名称进行修改
对uid不重复数据进行计数
该图显示了对uid去重后的数据总数

这种方法对大规模数据不适用,因为distinct最多只能使用16M空间,会出现下面的错误
在这里插入图片描述



2、采用MongoDB 的aggregate进行分组计数

官方文档地址 https://docs.mongodb.com/manual/aggregation/

下面是官网截图,aggregate的使用一目了然
在这里插入图片描述

aggregate基本功能是match,group。

match的功能是实现匹配功能,也就是说,会将key下面对应的value值选出来。

找出分数
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值