问题来源:https://groups.google.com/forum/#!topic/mongodb-user/BpgEaRqrKsA
Collection C1的部分数据如下:

要求按name分组,每组数据是相同的name对应的子文档中的users字段,且数据不能重复。计算结果类似:

集算器代码:

A1:连接MongoDB,连接字格式为mongo://ip:port/db?arg=value&… 。
A2: 使用find函数从MongoDB中取数并排序,形成游标。collectoin是c1,过滤条件是空,取出_id之外的所有字段,并按name排序。集算器的find函数和mongdb的find+sort+limit函数类似,过滤条件的写法遵循mongodb规范。
A3: 循环从游标读数,每次取name字段相同的一组文档。A3的作用范围是缩进的B3到B5,其间可以用A3来引用循环变量。
B3:取出本组文档的所有users字段,如下:

B4:合并本组各文档的users,并去除重复。
B5:将B4不断地追加到B2中。B2如下:

B2就是本案例的计算目标。如果计算结果太多导致内存放不下,可以在B5中用函数export@j将B4转为json串,再不断地追加到文本文件中。
A6:关闭MongoDB。
本文介绍如何使用集算器从MongoDB中获取数据,并通过特定的步骤实现数据的分组及去重操作。具体包括连接MongoDB数据库、读取指定集合的数据、对数据进行排序和分组、提取并去重特定字段等。
686

被折叠的 条评论
为什么被折叠?



