Selenium 模拟登录淘宝,获取cookies给requests使用

本文介绍了如何在Python中使用Selenium模拟登录淘宝网站,并获取登录后的cookies供requests库使用,以解决爬虫遇到的登录拦截问题。通过运行SeleniumGetCookies类的run()函数,可以得到session。

文章目录


前言

今天爬取淘宝商品图片,遇到登录拦截,看了淘宝的登录 url 里的请求参数,好多加密,果断放弃。
不过可以用selenium模拟登录,然后获取cookies给requests使用,开整。


代码

from selenium import webdriver
from selenium.webdriver.support import wait
from selenium.webdriver.common.by import By
import requests
from requests.cookies import RequestsCookieJar
from fake_useragent import UserAgent


class SeleniumGetCookies:
    def __init__(self, user, pwd):
        self.user = user
        self.pwd = pwd

        ua = UserAgent()
        headers = {
   
   
            'User-Agent': ua.random
        }
        self.session = requests.Session()
        self.session.headers.update(headers)
		
		# 配置chrome,绕过淘宝的检测
        option = webdriver
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值