Python3爬虫新手项目详解:爬取豆瓣读书的前50条评论内容并显示评分。提示:有的评论不包含评分
爬取《三体》,相关网页内容如下:
https://book.douban.com/subject/2567698/comments/hot?p=1
开始之前我们先明确一下爬虫的基本步骤:
抓取
urllib内建模块 urllib.request
requests第三方库(中小型)
scrapy框架(大型)
解析
BeautifulSoup库
re模块
这次我们就用到...
原创
2019-08-10 14:46:25 ·
4298 阅读 ·
1 评论