
Python爬虫
文章平均质量分 66
AdaminaWhisper
菜菜
展开
-
代理、禁止重定向、retrying、超时处理
代理、禁止重定向、retrying原创 2022-03-10 10:12:01 · 876 阅读 · 0 评论 -
cookie
一、cookie (潇湘书院)登录后有出现cookie,里面包含用户名和密码,但密码是通过加密的,解密需直到加密的方法。点击网站前面的锁,打开cookie删除全部的cookie的数据,用户登录信息被清除了。什么时候使用cookie:模拟登录不好编写 只要cookie没有账号密码 网站根据cookie对用户进行推荐,专门爬取某人的个人推荐如何在代码中利用cookie:将cookie写入headers get方法中cookies参数进行传递(必须为字典类型...原创 2022-03-09 22:29:58 · 674 阅读 · 0 评论 -
Python爬虫概述
一、访问robots协议1、淘宝网站查看robots协议,将蓝色行改成robots.txt2、显示的是根目录下的所有文件都不允许爬取二、DNS域名解析1、向百度发起一个域名请求,回复的是220.181.38.2512、网络的本质是通过一个IP地址实现一个请求三、抓包以及了解基本名词11、状态码表示响应成功100-199 服务器成功接收部分请求,要求客户端继续提交其余请求才能完成整个处理过程200~299表示服务器成功...原创 2021-10-19 20:32:39 · 194 阅读 · 0 评论