导读:MongoDB是一个开源文档数据库,旨在实现卓越的性能、易用性和自动扩展。Pandas是受R数据框架概念启发形成的框架。本文的目的是展示一些示例,以便你开始使用MongoDB和Pandas。
作者:萨扬·穆霍帕迪亚(Sayan Mukhopadhyay)
如需转载请联系大数据(ID:hzdashuju)
01 Python版本MongoDB
MongoDB是一个开源文档数据库,旨在实现卓越的性能、易用性和自动扩展。MongoDB确保不需要对象关系映射(ORM)来促进开发。包含由字段和值对组成的数据结构的文档在MongoDB中称为记录(record)。这些记录类似于JSON对象。字段的值可以包括其他文档、数组和文档数组。
{ "_id":ObjectId("01"), "address": { "street":"Siraj Mondal Lane", "pincode":"743145", "building":"129", "coord": [ -24.97, 48.68 ] }, "borough":"Manhattan",
1. 将数据导入集合
mongoimport可使用系统脚本或命令提示符将文档放入数据库的集合中。如果集合预先存在于数据库中,操作将首先丢弃原始集合。
mongoimport --DB test --collection restaurants --drop --file ~/ downloads/primer-dataset.json
mongoimport命令连接到端口号为27017的本地运行的MongoDB实例。选项 --file 提供了导入数据的方法,此处为 ~/downloads/primer-dataset.json。
要将数据导入到运行在不同主机或端