python爬虫(一) —— 豆瓣电影TOP前250信息爬取
爬取过程虽然简单,但以学习为目的,在中间使用了一些库以及python语法的高级用法。
获取电影详情页
打开https://movie.douban.com/top250? 网址,翻到最下面,打开开发者工具,随便点击翻页。会看到下图请求的URL,URL里只有start变化,每次翻页加25,到250截至。
全篇提取信息全用正则表达式。
获取详情页
def get_detail_url(base_ur...
原创
2019-12-25 23:40:16 ·
1308 阅读 ·
0 评论