
爬虫实战
圣默
性别男 爱好宅 你想怎样?雨偶无瓜
展开
-
爬虫实战之《流浪地球》豆瓣影评分析(三)
4. 分析评论数量及评分与时间的关系首先导入数据,进行一个初步的统计:import pandas as pddata = pd.read_csv('doubanliulangdiqiu.csv',encoding ='GB18030')data['评分'].value_counts()可以看到这样的情况:如果没有数据,可以去看爬虫实战之《流浪地球》豆瓣影评分析(一)的爬取过程。先...原创 2020-04-06 23:16:37 · 3835 阅读 · 3 评论 -
爬虫实战之《流浪地球》豆瓣影评分析(二)
3. 分析好评与差评的关键信息依靠绘制词云图,来分析好评与差评的关键信息的区别数据预处理依靠上一篇爬取到的csv文件,来进行分析,首先导入文件,重点是短评正文的信息。首先是使用结巴库来进行分词,然后去除停用词(停用词是网上公开的,可以自己去找。代码:import pandas as pdimport jiebadata = pd.read_csv("doubanliulangdi...原创 2020-04-06 17:07:04 · 2234 阅读 · 1 评论 -
爬虫实战之《流浪地球》豆瓣影评分析(一)
1. 背景与挖掘目标豆瓣(douban)是一个社区网站。网站由杨勃(网名“阿北”) 创立于2005年3月6日。该网站以书影音起家,提供关于书籍、电影、音乐等作品的信息,无论描述还是评论都由用户提供(User-generated content,UGC),是Web 2.0网站中具有特色的一个网站。网站还提供书影音推荐、线下同城活动、小组话题交流等多种服务功能,它更像一个集品味系统(读书、电影、...原创 2020-04-05 14:37:36 · 4009 阅读 · 3 评论