python3爬新浪单条微博评论

杰伦发了新歌,文山微博炸了......

1,准备

在https://m.weibo.cn/登录微博,找到要爬的微博


按F12找到这个界面,注意黄色的部分,没有内容的话就F5刷一下


2,开始

import requests
import json  
import pymongo  
import re
client = pymongo.MongoClient('localhost', 27017)  
weibo = client['weibo']
comment_ = weibo['comment_fangwens']
headers = {  
    "Cookies":'你的cookie,见马赛克部分',  
    "User-Agent":'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36'  
} 
for i in range (0,101):
    url_comment = 'https://m.weibo.cn/api/comments/show?id=4237925061907207&page=%d'%(i)
    wb_data = requests.get(url_comment,headers=headers).text
    data_comment = json.loads(wb_data)
    data = data_comment['data']
    for a in data['data']:
        print (re.sub('<[^>]*>', '',a['text']))

3、结果

只要评论内容不关注评论人,时间,点赞数等

结果是这样的,比较简陋,但差不多够用了……


做成词云


求求文山老师救救杰伦吧!

over

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值