scrapy模拟登录
注意:模拟登陆时,必须保证settings.py里的COOKIES_ENABLED(Cookies中间件) 处于开启状态
COOKIES_ENABLED = True
或# COOKIES_ENABLED = False
策略一:直接POST数据(比如需要登陆的账户信息)
只要是需要提供post数据的,就可以用这种方法。下面示例里post的数据是账户密码:
- 可以使用yield scrapy.FormRequest(url, formdata, callback)方法发送POST请求。
- 如果希望程序执行一开始就发送POST请求,可以重写Spider类的start_requests(self)方法,并且不再调用start_urls里的url。
import scrapy
class MyrenrenSpider
本文详细介绍了使用Scrapy框架进行模拟登录的四种策略:直接POST数据、标准模拟登录步骤、利用保存的Cookie模拟登录以及使用selenium插件。强调了在settings.py中启用COOKIES_ENABLED的重要性,并提供了具体的代码示例,包括使用FormRequest和中间件来管理登录状态。
订阅专栏 解锁全文
1225

被折叠的 条评论
为什么被折叠?



