
爬虫
SuperFengCode
这个作者很懒,什么都没留下…
展开
-
requests库+正则表达式爬取猫眼电影
我们用 requests 库 + 正则表达式构建一个简陋的爬虫,虽然这个爬虫很简陋,但是通过这个例子我们可以对爬虫有一个很好的了解。这次目的是爬取猫眼电影 TOP 100,要想爬取这些信息,我们首先要到猫眼电影 TOP 100 的页面上观察一下(也可以说踩点)。网址为:https://maoyan.com/board/4这就是我们要爬取的页面,现在我们来写一段代码自动访问这...原创 2019-07-31 15:43:30 · 1036 阅读 · 0 评论 -
XPath+requests库爬取猫眼电影
之前我们用正则表达式 + requests 库爬取猫眼电影 TOP 100,原文链接在这里:https://blog.youkuaiyun.com/S1998F/article/details/97916617但是正则表达式很复杂,也很难学,我们能不能不用正则表达式匹配想要的内容呢?答案是可以的,这次我们选用 XPath 来解析内容。要获取的内容还是排名、电影海报、电影名称、演员和上...原创 2019-08-01 10:57:46 · 769 阅读 · 0 评论