
爬虫
TTLLZZHH
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python网络爬虫爬取汽车之家的最新资讯和照片
实现的功能是爬取汽车之家的最新资讯的链接题目和文章中的照片爬虫需要用到我们使用了 requests 做网络请求,拿到网页数据再用 BeautifulSoup 进行解析首先先检查是否安装了pip,如果已经安装了pip,直接pip install requests,pip uninstall BeautifulSoup,安装成功就可以爬取数据了,以下就是要爬的内容这是网页的源代码,就是通过...原创 2018-12-02 11:31:06 · 1299 阅读 · 0 评论 -
爬虫中的Header请求头
很多网站再申请访问的时候没有请求头访问会不成功,或者返回乱码,最简单的解决方式就是伪装成浏览器进行访问,这就需要添加一个请求头来伪装浏览器行为**Header**请求头可以自己来写,其实很简单打开任意浏览器某一页面(要联网),按f12,然后点network,之后再按f5,然后就会看到“name”这里,我们点击name里面的任意文件即可。之后右边有一个headers,点击headers...原创 2018-12-04 16:37:53 · 14139 阅读 · 2 评论 -
爬虫实现自动登陆抽屉网,实现对文章点赞,收藏,评论
抽屉网比较特别,一般的网站在登陆的时候会返回一个cookies,以后再次登陆的时候只要带着这个cookies去登陆就可以,但是抽屉网得特别之处在于登陆后返回给用户得cookies是没用得,这是抽屉网做出来混淆视听得一种做法正解我们第一次打开抽屉网得时候,用get请求发送,这时候其实抽屉网会返回一个cookies在然后在此页面进行登陆的时候,发送post请求,其实就是对get请求返回得coo...原创 2018-12-07 19:13:58 · 919 阅读 · 0 评论