使用python爬虫模拟12306登陆
需要用到requests库函数,下载requests库函数地方法:直接在命令行输入以下代码就可以了就可以了。
pip install requests
模拟登陆的一般步骤:伪装爬虫–>实例化一个session–>访问登陆的网络求情–>获取验证码(一般登陆都会有验证码验证)–>验证账号密码–>获取token验证–>登陆成功(访问的网络请求需要我们在12306官网自己找到)
验证验证码:12306的验证码是点击验证的,是通过获取点击的坐标来验证是否点击正确,可以设置好每张图片的编号,一个编号对应一个坐标。
代码如下
"""
模拟登陆1206
"""
import base64
import requests
import re
import config
def get_point(index):
index = index.split(',')
loc = {
'1': '43,45',
'2': '106,45',
'3': '167,45',
'4': '259,45',
'5': '42,120',
'6': '106,120',
'7': '167,120',
'8': '259,120',
}
answer = []
for t in index:
answer.append(loc[t])
return ','.join(answer)
# 首先做好伪装,伪装成浏览器
# 实例化一个session
session = requests.Session() # 自动的处理cookie
headers = {
'User-Agent': 'Mozi