Python—爬虫之小饼干cookies & session会话(模拟登录)

本文介绍了Python爬虫中如何使用POST请求、理解Cookies和Session的用法,以及如何处理Cookies过期问题。通过示例代码展示了模拟登录的过程,并讲解了将Cookies存储为TXT文件以优化代码和应对异常的处理机制。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


本篇的重点:cookies是个人的账号密码信息,千万不能外泄哟!!!

post请求

简单说明一下post请求,请看以下三点:
①:post和get都可以带着参数请求方式,不过get请求的参数会在url上显示出来;
②:像账号密码这一类的私密信息,应该使用post请求;
③:get是明文显示,post是非明文显示;
④:get请求会应用于获取网页数据,post请求则应用于向网页提交数据,比如提交表单类型数据(像账号密码就是网页表单的数据)

cookies及其用法

登录网址时,记住要勾选记住登录信息,才会产生cookies数据。
在这里插入图片描述
找到你需要填写评论的网站位置,利用之前我们说到的network的方法,找到网页的位置,如何找网页位置点这儿有说明
在这里插入图片描述
上一波代码作为展示,此处只为展示逻辑流程,对应的大家要更改自己想要操作的网站哟,一定要敲代码ヾ(◍°∇°◍)ノ゙

import requests

#第一步请求网站并登录网站
url = '你想要操作的网站的网址'

#设置请求头
headers = {
   
   
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36'
}

#设置参数,requests headers 存储的是浏览器的请求信息,我们需要从这里面调用所有的参数,直接复制下来即可,注意加引号和逗号
data = {
   
   
'log': '填写你的用户名',
'pwd': '填写你的密码',        
'wp-submit': '登录',
'redirect_to': 'https://wordpress-edu-3autumn.localprod.forc.work',
'testcookie': '1'
}

#用requests.post发起请求,放入参数:请求登录的网址、请求头和登录参数,然后赋值给login_in。
login_in = requests.post(url,headers = headers,data = data)

#提取cookies的方法:调用requests对象(login_in)的cookies属性获得登录的cookies,并赋值给变量cookies。
cookies = login_in.cookies

#第二步,发表评论,前面的获取网址,设置参数都与上面一样
url_1 = '网址'
data_1 = {
   
   
'comment':input('请输入你想要发表的评论'),
'submit': '发表评论',
'comment_post_ID': '13',
'comment_parent': '0'
}

#用requests.post发起发表评论的请求,放入参数:文章网址、headers、评论参数、cookies参数,赋值给comment。
comment = requests.post(url_1,headers = headers,data = data_1
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值