Python—爬虫之小饼干cookies & session会话(模拟登录)
本篇的重点:cookies是个人的账号密码信息,千万不能外泄哟!!!
post请求
简单说明一下post请求,请看以下三点:
①:post和get都可以带着参数请求方式,不过get请求的参数会在url上显示出来;
②:像账号密码这一类的私密信息,应该使用post请求;
③:get是明文显示,post是非明文显示;
④:get请求会应用于获取网页数据,post请求则应用于向网页提交数据,比如提交表单类型数据(像账号密码就是网页表单的数据)
cookies及其用法
登录网址时,记住要勾选记住登录信息,才会产生cookies数据。
找到你需要填写评论的网站位置,利用之前我们说到的network的方法,找到网页的位置,如何找网页位置点这儿有说明
上一波代码作为展示,此处只为展示逻辑流程,对应的大家要更改自己想要操作的网站哟,一定要敲代码ヾ(◍°∇°◍)ノ゙
import requests
#第一步请求网站并登录网站
url = '你想要操作的网站的网址'
#设置请求头
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36'
}
#设置参数,requests headers 存储的是浏览器的请求信息,我们需要从这里面调用所有的参数,直接复制下来即可,注意加引号和逗号
data = {
'log': '填写你的用户名',
'pwd': '填写你的密码',
'wp-submit': '登录',
'redirect_to': 'https://wordpress-edu-3autumn.localprod.forc.work',
'testcookie': '1'
}
#用requests.post发起请求,放入参数:请求登录的网址、请求头和登录参数,然后赋值给login_in。
login_in = requests.post(url,headers = headers,data = data)
#提取cookies的方法:调用requests对象(login_in)的cookies属性获得登录的cookies,并赋值给变量cookies。
cookies = login_in.cookies
#第二步,发表评论,前面的获取网址,设置参数都与上面一样
url_1 = '网址'
data_1 = {
'comment':input('请输入你想要发表的评论'),
'submit': '发表评论',
'comment_post_ID': '13',
'comment_parent': '0'
}
#用requests.post发起发表评论的请求,放入参数:文章网址、headers、评论参数、cookies参数,赋值给comment。
comment = requests.post(url_1,headers = headers,data = data_1