- 博客(4)
- 收藏
- 关注
原创 python爬取电影热评生成高频词词云
目标:针对一部电影,爬取他的热评高频词,并生成词云 分解目标: 1、爬取热评内容,只保留文本部分 2、热评文本保存到本地的txt文档,以便后续的分词 3、文本分词 4、生成词云 1、爬取热评 拿到一个电影:https://movie.douban.com/subject/27010768/ 这是他的热评列表https://movie.douban.com/subject/27...
2019-09-27 15:29:09
1584
原创 scrapy执行常见错误及解决方案
一个简单项目,爬取豆瓣top250书单 运行方法: 在cmd中运行 创建main.py运行 在编译器中运行main文件,提示: 在cmd中输入指令:scrapy crawl douban 也出现以上错误,或者出现:没找到pywin32 解决方案: 注意main文件与scrapy.cfg文件同级 运行时(cmd或编译器)路径切换到scrapy.cfg的所在文件夹位置 先安装py...
2019-04-01 12:30:02
1486
原创 python爬取下厨房本周受欢迎菜谱
下厨房本周最受欢迎菜品: http://www.xiachufang.com/explore/ 爬取代码: import requests from bs4 import BeautifulSoup res=requests.get('http://www.xiachufang.com/explore/') html=res.text soup=BeautifulSoup(html,'...
2019-03-12 12:11:08
2983
1
原创 请教python3爬取没数字的星级?
请教: 星级的源码是这样的,如何用python3爬取星级呢? 初学者,求大佬们赐教o(╥﹏╥)o 其他的书名和价格都可以拿到,就是这个星级不知道咋办 import requests from bs4 import BeautifulSoup res=requests.get('http://books.toscrape.com/catalogue/category/books/travel_2/...
2019-03-11 16:27:34
832
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人