Python3爬虫简易实例1（Requests正则）

最新推荐文章于 2024-12-05 09:18:12 发布

__XYQ

最新推荐文章于 2024-12-05 09:18:12 发布

阅读量1k

点赞数 1

分类专栏： Python爬虫文章标签： python 爬虫

本文链接：https://blog.youkuaiyun.com/qq_41144008/article/details/78815663

版权

抓取某电影网TOP100

1.分析源码，以便于写正则表达式

这里是网页关键部分的源码：

然后针对它写正则表达式：

pattern = re.compile('<dd>.*?board-index.*?>(\d+)</i>.*?data-src="(.*?)".*?name"><a'
                     + '.*?>(.*?)</a>.*?star">(.*?)</p>.*?releasetime">(.*?)</p>'
                     + '.*?integer">(.*?)</i>.*?fraction">(.*?)</i>.*?</dd>', re.S)

然后完善：