爬虫实战
圣默
性别男 爱好宅 你想怎样?雨偶无瓜
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
爬虫实战之《流浪地球》豆瓣影评分析(三)
4. 分析评论数量及评分与时间的关系 首先导入数据,进行一个初步的统计: import pandas as pd data = pd.read_csv('doubanliulangdiqiu.csv',encoding ='GB18030') data['评分'].value_counts() 可以看到这样的情况: 如果没有数据,可以去看爬虫实战之《流浪地球》豆瓣影评分析(一)的爬取过程。 先...原创 2020-04-06 23:16:37 · 3888 阅读 · 3 评论 -
爬虫实战之《流浪地球》豆瓣影评分析(二)
3. 分析好评与差评的关键信息 依靠绘制词云图,来分析好评与差评的关键信息的区别 数据预处理 依靠上一篇爬取到的csv文件,来进行分析,首先导入文件,重点是短评正文的信息。 首先是使用结巴库来进行分词,然后去除停用词(停用词是网上公开的,可以自己去找。 代码: import pandas as pd import jieba data = pd.read_csv("doubanliulangdi...原创 2020-04-06 17:07:04 · 2278 阅读 · 1 评论 -
爬虫实战之《流浪地球》豆瓣影评分析(一)
1. 背景与挖掘目标 豆瓣(douban)是一个社区网站。网站由杨勃(网名“阿北”) 创立于2005年3月6日。该网站以书影音起家,提供关于书籍、电影、音乐等作品的信息,无论描述还是评论都由用户提供(User-generated content,UGC),是Web 2.0网站中具有特色的一个网站。 网站还提供书影音推荐、线下同城活动、小组话题交流等多种服务功能,它更像一个集品味系统(读书、电影、...原创 2020-04-05 14:37:36 · 4083 阅读 · 3 评论
分享