
爬虫
b1gx
这个作者很懒,什么都没留下…
展开
-
爬取电影天堂电影详情和磁力链接
import requestsfrom lxml import etreeheaders = { 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'}base_url =...原创 2018-12-26 23:58:27 · 10864 阅读 · 0 评论 -
爬取豆瓣正在上映的影片信息
import requestsfrom lxml import etree# 将目标网站上的页面抓取下来# headers -> url -> requests -> response# response.text 返回的是一个经过解码后的字符串,是str(unicode)类型# response.content 返回的是一个原生的字符串,就是从网页...原创 2018-12-26 00:10:08 · 1290 阅读 · 0 评论 -
爬取链家租房信息
通过观察 发现url为 https://nb.lianjia.com/zufang/pg{}/ 其中{}中为页码 即1,、2、3、4…一共有100页,所一设置一个循环来产生这些urlfor x in range(1, 101): url = 'https://nb.lianjia.com/zufang/pg%d/' % x通过浏览器的开发者工具栏可知 该 url的请求的...原创 2019-04-05 23:47:35 · 953 阅读 · 0 评论