python中使用collection.find()在mongodb中查询大量数据时的问题

最新推荐文章于 2025-09-14 06:35:54 发布

原创最新推荐文章于 2025-09-14 06:35:54 发布 · 1.6w 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#mongodb #python

mongodb 同时被 2 个专栏收录

1 篇文章

订阅专栏

python

1 篇文章

订阅专栏

本文介绍在Python中使用MongoDB的find方法时遇到的问题及两种解决方法：设置batch_size参数来控制每次读取的数据量，或将游标转换为列表以一次性获取所有数据。

部署运行你感兴趣的模型镜像

问题描述：

假设collection中有2000条数据，执行如下代码：

i=1
for content in collection.find():
    print i++

打印到101时，打印停止，等待若干秒后继续打印完全。

分析：

mongodb的find()方法返回游标cursor，这里有一个限制，默认包含101个文档。官方文档。

解决方案：

1.设置batch size:

i=1
for content in collection.find().batch_size(500):
    print i++

不建议设太大，设置太大的话，会在打印之前话费大量时间读取cursor。所以建议设置适量的值，读取一些cursor，打印一些数据。

2.将cursor转化为list：

result = collection.find()
result_list = list(result[:])
i=1
for document in result_list
    print i++

python不像php有toArray()方法将结果集转化为数组一次性读取，可以转化成列表 , 将数据放在RAM中，但是转化的过程一样要耗时。

您可能感兴趣的与本文相关的镜像

Python3.9

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

VVVinegar

关注关注

4
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

python3操作MongoDB的crud以及聚合案例，代码可直接运行（python经典编程案例）

数据知道的博客

06-24

8万+

以下是 Python3 操作 MongoDB 的 CRUD（增删改查）以及聚合操作的详细教程。

collection.find()¶

BLOG域名:programb.blog.youkuaiyun.com

04-25

470

MongoDB Logo ServerDriversCloudToolsGuides Get MongoDB Close × MongoDB Stitch Introduction Tutorials Users & Authentication MongoDB Atlas Overview Configure MongoDB Link a MongoDB ...

参与评论您还未登录，请先登录后发表或查看评论

`collection.findOne()` 是MongoDB（一种文档数据库）中的一个内置方法，用于从集合中查找并返回第一个匹配给定查询条件的文档

BLOG域名:programb.blog.youkuaiyun.com

04-25

1296

如果你遇到了特殊的正则表达式语法问题，可能需要查阅具体的正则表达式引擎文档，以确认该引擎是否支持某种方式来临时禁用或开启特殊字符的转义行为。在正则表达式中，如果你想要匹配一个特定的特殊字符而不进行转义，通常不需要关闭特殊字符解析，因为这些字符默认就是它们的原始含义。在Java中，除了基本的正则表达式元素，还有一些标志（Flags）用于调整正则表达式的匹配行为。方法的第二个参数（flag）是一个可选的标志，它用于指定正则表达式的匹配模式。这个方法接受一个字符串参数，该字符串是你想要编译的正则表达式。

`collection.find()` 是MongoDB（一种文档数据库）中的一个操作，用于从集合（即database中的表）中查询文档（ documents）

BLOG域名:programb.blog.youkuaiyun.com

04-25

1801

是MongoDB（一种文档数据库）中的一个操作，用于从集合（即database中的表）中查询文档（ documents）。记得在进行查询时，始终考虑查询性能和数据一致性，以及可能的更新操作对查询结果的影响。: MongoDB支持复杂的聚合管道操作，可以对数据进行分组、过滤、计算和重新排列，用于数据分析和报告。可以是你想要应用的查询条件，如匹配特定字段的值，或者使用复杂的查询运算符（如。这个命令会显示集合的统计信息，包括索引的状态，比如使用的索引、平均访问时间等。

MongoDB学习 (六)：查询

萌萌的It人 www.itmmd.com

07-06

2508

本文将介绍操作符的使用，配合操作符，我们可以执行更加复杂的操作。目录查询操作集合查询方法 find()查询内嵌文档查询操作符(内含数组查询)"$gt" 、"$gte"、 "$lt"、 "$lte"、"null查询"、"$all"、"$size"、"$in"、"$nin"、"$and"、"$nor"、"$not"、"$or"、"$exists"、"$mod"、"$regex"、"$where"、"

MongoDB - 集合方法 db.collection.find()

你今天真好看呀

07-28

775

参数确定匹配文档中返回哪些字段。方法限制结果集中的文档数量。方法对结果集中的文档排序。方法控制结果集的起点。

Python3中使用PyMongo的方法详解

weixin_33749131的博客

01-17

271

前言本文主要给大家介绍的是关于在Python3使用PyMongo的方法，分享出来供大家参考学习，下面话不多说了，来一起看看详细介绍：MongoDB存储在这里我们来看一下Python3下MongoDB的存储操作，在本节开始之前请确保你已经安装好了MongoDB并启动了其服务，另外安装好了Python的PyMongo库。没有安装的朋友们可以参考：https://www.jianshu.com/p/c6...

Python库collections

热门推荐

如渊的博客

06-25

1万+

官方说法：collections模块实现了特定目标的容器，以提供Python标准内建容器dict ,list , set , 和tuple的替代选择。通俗说法：Python内置的数据类型和方法，collections模块在这些内置类型的基础提供了额外的高性能数据类型，比如基础的字典是不支持顺序的，collections模块的OrderedDict类构建的字典可以支持顺序，collections模块的这些扩展的类用处非常大，熟练掌握该模块，可以大大简化Python代码，提高Python代码逼格和效率，高手入门

python操作mongodb根据_id查询数据的实现方法

09-10

在Python中，MongoDB是一个广泛使用的NoSQL数据库，它的灵活性和高性能使得它在处理大量非结构化数据时非常有效。而_pymongo_是Python官方推荐的MongoDB驱动，提供了丰富的功能来操作MongoDB数据库。在本文中，我们...

Python中的MongoDB基本操作：连接、查询实例

09-10

MongoDB 是一个流行的开源NoSQL数据库，它使用JSON-like文档结构进行数据存储，适用于需要处理大量非结构化或半结构化数据的应用程序。在Python中，我们可以使用`pymongo`库来与MongoDB进行交互。以下是关于Python中...

最全总结 | 聊聊 Python 数据处理全家桶（MongoDB 篇）

YLF123456789000的博客

05-30

1006

本篇文章继续聊另外一种数据类型：MongoDBMongoDB 是基于分布式存储，由 C++ 编写的开源的 NoSql 数据库MongoDB 的内容存储类似 JSON 对象，数据结构包含 3 种分别是：数据库 - Databases对应关系型数据库中的数据库（Database）集合 - Collection对应关系型数据库中的 Table 表（Table）文档 - Document对应数据库表中的一条数据（Row Data）

MongoDB的db.collection.find()和db.numbers.insert()用法

聆听。。花开雨落的博客

09-19

1923

1.db.collection.find(query, projection) 若不指定 projection，则默认返回所有键，指定 projection 格式如下，有两种模式 db.collection.find(query, {title: 1, by: 1}) // inclusion模式指定返回的键，不返回其他键 db.collection.find(query, {title:...

DataRowCollection.Find(object []keys)的用法

坚定的锡兵

12-21

2791

一个主键没有问题！但是假如我的DataTable有两个主键。ID1和ID2那么传一个两个长度的对象数组过去（3，6）,我的意思是找ID2＝3并且ID1＝13的他怎么知道我的对应顺序了？？经过我的测试结果是测试代码如下: DataTable dt = new DataTable(); DataColumn pkCol = new DataColumn("I

mongoDB 查询（三）

Allen_Walker_QAQ的博客

01-18

584

1.find()详解 db.collection.find() - 查询集合，无参数则查询所有，并返回一个游标对象用法 db.collection.find(query, projection) 参数参数描述 query 是可选参数，基于查询操作符指定了查询的条件，若希望返回collection中的所有文件，则无需指定该query 参数，直接 db.colle...

MongoDB 中查询(find) 指南

白石的专栏

11-10

1万+

在本文中，我们学习了使用各种方法在 MongoDB 中执行*查找操作*。我们执行*find*以使用查询运算符检索与选择标准匹配的特定文档。此外，我们还学习了执行*投影*以确定匹配文档中返回的字段。

MongoDB常用的操作-（find方法）

记录总结工作过往

05-26

3288

db.collection.find是mongoDB的一个方法。用于查询集合或视图中符合条件的Document,并返回所选document。与SQL中的Select有相似功能；

Python PyMongo 深度解析：高效获取 MongoDB 集合所有文档 (`collection.find()` 高级指南)

weixin_42107409的博客

09-14

1018

本文深入解析了使用 PyMongo 的 collection.find() 方法高效获取 MongoDB 集合所有文档的技术。文章从基础概念入手，详细介绍了游标(Cursor)的工作机制、find()方法的各项参数配置，以及大数据集处理时的内存管理与性能优化策略。主要内容包括环境准备、核心检索方法详解、游标迭代方式、错误处理，以及索引应用、字段投影等高级优化技巧。文章特别强调了生产环境中的最佳实践，如避免一次性加载大型数据集、合理使用分页查询等，帮助开发者构建高效可靠的 MongoDB 数据检索方案。

mongodb--find基础用法

weixin_30553065的博客

08-15

345

聚集集合查询 1、查询所有记录 db.userInfo.find(); 相当于：select* from userInfo; 默认每页显示20条记录，当显示不下的情况下，可以用it迭代命令查询下一页数据。注意：键入it命令不能带“；” 但是你可以设置每页显示数据的大小，用DBQuery.shellBatchSize= 50;这样每页就显示50条记录了。 2、查询去掉后的当前聚集集合中的某...

MongoDB常用操作

weixin_30835933的博客

11-10

807

一、查询 find方法 db.collection_name.find(); 查询所有的结果： select * from users; db.users.find(); 指定返回那些列（键）： select name, skills from users; db.users.find({},{'name':1,'skills':1}); 补充说明...

python中 mongodb find查询返回 pymongo.cursor.Cursor Object at