Python爬虫--动态获取cookies

最新推荐文章于 2024-12-25 16:31:01 发布

测试_Rookie

最新推荐文章于 2024-12-25 16:31:01 发布

阅读量5.7k

点赞数 4

分类专栏：爬虫文章标签： python 爬虫搜索引擎 java爬虫程序爬虫搜索关键字搜索

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_45651841/article/details/107358424

版权

本文介绍了在Python爬虫中遇到的接口加密和cookies问题，推荐使用selenium库进行模拟登陆以获取网页信息。详细讲解了selenium的安装、元素获取以及如何处理cookies，特别指出在无头浏览器模式下cookies可能失效的问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

我们在利用requests库发送请求时常遇到接口加密，cookies，js混淆等等问题。这个时候，推荐简单粗暴的selenium库来实现获取网页信息，就不用为反爬而发愁。（当然有些网站也会对selenium来做一些反爬措施）

1. selenium模拟登陆

1.1 安装

安装命令很简单，在terminal中执行下面这条命令即可。或在pycharm中setting>Project>Interpreter里面下载

pip install selenium

1.2 获取元素

首先导入

from selenium import webdriver

实例化

driver = webdriver.Chrome()

打开URL

driver.get('https://www.zhihu.com/signin')

定位登陆信息（以知乎为例）

us

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。