摘要: 之前我们爬取的实习僧、糗事百科、网易新闻都是不需要登陆,不需要你去做账号、Cookies、Session等等,顶多只需要一个 headers (请求头),但还有一类是需要:你(注册)账号登陆才能进行后续的操作。
例如:淘宝、知乎、豆瓣之类的需要你登陆的。
我们之前又整合一些 requests 库 提供 http 的所有基本请求方式:
Python资源共享群:484031800
回顾:
1.GET请求
可利用params参数
输出结果:
2.POST请求
利用data参数 为POST添加参数:
上传文件的方式:
方法一:
方法二:
我个人更习惯或者说更 Python 的操作,是方法二:
&nb

本文介绍了Python网络爬虫中如何处理需要登陆的网站,包括GET和POST请求、使用Cookies以及Selenium模拟登陆的方法。通过实际操作展示了登录目标网页itjuzi.com的过程。
最低0.47元/天 解锁文章
3万+

被折叠的 条评论
为什么被折叠?



