最新!python模拟登陆知乎

本文分享了两种爬取知乎数据的方法,一是使用selenium模拟浏览器自动登录,二是利用已登录状态的cookie实现自动登录,助你顺利获取所需数据。

想爬一些知乎的数据,但过程并不顺利,这几天看了网上很多大神的帖子,最近的也是18年8月的。目前知乎改版,网上现有的方法全部都不能登陆了,会报参数异常的错误。

捣鼓了好久,曲线救国,2种方法

一、selenium

用selenium模拟浏览器登陆,首先QQ要在电脑上登陆,python代码自动打开chrome浏览器,选择以QQ登陆的方式登陆知乎,这里需要人工点一次登陆才行。真的是曲线救国。。。。。。。

代码如下:

import time

from selenium import webdriver

# sys.setProperty("webdriver.chrome.driver", "C:\\Program Files (x86)\\Google\\Chrome\\Application\\chromedriver.exe");
wd = webdriver.Chrome('C:\\Program Files (x86)\\Google\\Chrome\\Application\\chromedriver.exe')
# 打开知乎首页
wd.get('https://www.zhihu.com/')
# 进入登陆页面
wd.find_element_by_xpath(".//*[@class='SignContainer-switch']/span").click()
# 点击社交网络账号登陆
wd.find_element_by_xpath(".//*[@class='Login-socialLogin']/button").click()  # 点击QQ登陆
wd.find_element_by_xpath(".//*[@class='Login-socialButtonGroup']/button[3]").click()  # 点击QQ登陆
time.sleep(10)  # 时间不够的自己加
wd.refresh()  # 一定要刷新

二、cookie

这个方法比上一个方法简单

自己先在网页上登陆一次知乎,然后把保存在本地的cookie复制下来

在python的请求头里加上你的cookie,大功告成,下次自动登陆

(务必把cookie的所有内容复制下来)

代码如下:

import requests

headers={
    'User-Agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.181 Safari/537.36',
    'Referer':'https://www.zhihu.com/',
    'Cookie':'xxxxxxxxxxxxxxxx'
}
res=requests.get("https://www.zhihu.com/search?type=content&q=python",headers=headers)
print(res.text)

 

Python 模拟登录乎涉及到网页自动化操作,通常利用如 Selenium 这样的库完成。下面是一个基本的步骤概览以及简化的示例代码说明如何通过 Python 和 Selenium 来模拟登录乎。 ### 步骤概述 1. **安装所需库**:首先需要安装 `selenium` 库,通常使用的是其对应的浏览器驱动,例如对于 Chrome 浏览器可以安装 `webdriver_manager` 来自动下载管理 WebDriver 执行文件。 2. **配置浏览器驱动**:设置好浏览器路径或者让系统自动下载驱动。 3. **打开浏览器导航**:使用 Selenium 控制浏览器打开页面,定位到登录界面。 4. **填写表单**:找到输入用户名、密码的元素,输入相应信息。 5. **提交登录请求**:触发登录请求,可能还需要处理验证码等额外验证环节。 6. **获取登录后的状态**:检查是否成功登录根据需要进一步操作。 ### 示例代码 ```python from selenium import webdriver from webdriver_manager.chrome import ChromeDriverManager from selenium.webdriver.common.keys import Keys # 配置浏览器驱动路径或使用系统默认 driver = webdriver.Chrome(ChromeDriverManager().install()) try: # 访问乎网站 driver.get("https://www.zhihu.com") # 寻找登录按钮点击 login_button = driver.find_element_by_link_text('登录') login_button.click() # 寻找用户名输入框输入 username_input = driver.find_element_by_name('username') username_input.send_keys('your_username') # 寻找密码输入框输入 password_input = driver.find_element_by_name('password') password_input.send_keys('your_password') # 提交登录表单 password_input.submit() # 等待页面加载确认登录成功 assert "个人中心" in driver.page_source finally: # 关闭浏览器窗口 driver.quit() ``` ### 注意事项 - **隐私和安全**:模拟登录过程中应当遵守网站的使用条款和隐私政策,避免滥用账号。 - **动态内容和反爬机制**:某些网站可能会有动态内容加载、滑块验证码或是更复杂的登录流程,上述代码可能无法直接应对所有情况,可能需要针对特定网站的特性进行调整。 - **错误处理**:上述代码未包含详细的异常处理逻辑,实际应用中应该添加适当的异常捕捉和处理机制。 通过以上步骤和代码示例,你可以开始学习如何使用 Python 的 Selenium 库来自动化完成登录过程,不过请注意合理合法地使用此类工具,尊重网站的规则和用户协议。---
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值