python爬虫实践之豆瓣登录

本文介绍如何使用selenium模块实现豆瓣网站的自动化登录过程。通过分析网页结构,编写Python代码,实现输入账号密码并自动登录的功能,最后输出登录后的URL和cookie。

目录

概述

准备

所需模块

涉及知识点

运行效果

完成爬虫

1. 分析网页

2. 爬虫代码


概述

使用selenium实现豆瓣登录

准备

所需模块

  • selenium模块

涉及知识点

  • python基础
  • selenium基础

运行效果

控制台打印:

浏览器效果(注释掉driver.quit()):

完成爬虫

1. 分析网页

现在需要输入电话号码或者邮箱及登录密码。

登录成功就会输出URL和登录成功的cookie。

2. 爬虫代码

from selenium import webdriver

# 输入手机号或邮箱
tel_or_email = input("请输入手机号或密码:")
password = input("请输入密码:")

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因,这里自定义了电脑本地谷歌浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"
driver = webdriver.Chrome(options=options)

# 打开URL
driver.get("https://accounts.douban.com/passport/login")

# 获取元素
driver.find_elements_by_xpath("//ul[@class='tab-start']/li")[1].click()
driver.find_element_by_id("username").send_keys(tel_or_email)
driver.find_element_by_id("password").send_keys(password)
driver.find_element_by_link_text("登录豆瓣").click()  # 点击“登录豆瓣”按钮

print(driver.current_url)  # 打印页面的URL
print(driver.get_cookies())  # 打印所有的cookie

# 关闭窗口
# driver.quit()

 

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值