python对于mongodb微博数据的操作

本文介绍了一个使用Python和pymongo库来查询MongoDB数据库的方法。该脚本从文本文件中读取ID列表,并统计每个ID在指定MongoDB集合中出现的次数。此过程涉及到将文本文件中的数据转换为列表,然后遍历MongoDB数据库中的记录,查找匹配的ID并计数。

自己现在正在使用python对于mongdb数据库的一些内容查询筛选

#coding=utf-8
#!/usr/bin/python 
from pymongo import MongoClient


#打开uids.txt
f = open('/Users/pc/Desktop/beifen.txt', 'r')
#读取出uids的内容存入list1中
list1 = f.read()
#以回车符把list1转化为arrr(其中arr的每个元素都是字符串)
arr = list1.split("\n")
#把arr的每个元素转化为int型数据
#arr = [int(arr) for arr in arr if arr ]
#计算arr的长度
lens = len(arr)
print lens
#定义一个数组长度与arr相同,全部赋值为0(作为储存id的次数的数组)
arrynum = [0 for x in len(arr)]
j = 0
#建立MongoDB数据库连接
client = MongoClient('222.27.227.104',27017)
#连接所需数据库,test为数据库名
db=client.test
#遍历weibo中的对象
for i in db.weibo_pc.find():
    flag = i.has_key("reId")
    j = j+1
    if flag == True:
         print '正在进行这是第',j,'条数据'
         arrynum[arr.index(str(i["reId"]))] = arrynum[arr.index(str(i["reId"]))] + 1
    else:
        print '正在进行这是第',j,'条数据'
        arrynum[arr.index(str(i["oriId"]))] = arrynum[arr.index(str(i["oriId"]))] + 1
print arrynum
p = open('/Users/pc/Desktop/huizong.txt', 'w+')
for x in range (0,957650):
    p.write(arr[x])
    p.write(",")
    p.write(str(arrynum[x]))
    p.write("\n")
f.close()
p.close()


评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值