python request版 模拟登陆appAnnie

本文介绍了一种使用Python的requests和BeautifulSoup库实现对AppAnnie网站的自动化登录流程,并通过正则表达式从网页中抓取所需数据的方法。详细展示了如何获取并设置csrftoken,构造请求头和数据参数,完成登录操作,以及如何发送GET请求获取特定页面内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

# coding: utf-8
import requests
import re
from bs4 import BeautifulSoup
url = 'https://www.appannie.com/account/login/?_ref=header'

session = requests.Session()
session.headers['user-agent'] = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36'
session.get(url)
token = session.cookies.get('csrftoken')
print(token)
header = {
"User-Agent": 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36',
"Host": "www.appannie.com",
'Connection': 'keep-alive',
'Accept': 'application/json, text/plain,*/*',
'Accept-Encoding': 'gzip, deflate, sdch',
'Accept-Language': 'zh-CN,zh;q=0.8',
'X-NewRelic-ID': 'VwcPUFJXGwEBUlJSDgc=',
'X-Requested-With': 'XMLHttpRequest',
}
data = {
'csrfmiddlewaretoken': token,
'next': '/dashboard/home/',
'username': '1@qq.com',
'password': '1'
}
cookies = session.cookies
r = session.post(url, data)
#url_1 = "https://www.appannie.com/ajax/top-chart/table/?market=google-play&country_code=US&category=1&date=2018-12-26&rank_sorting_type=rank&page_size=100&order_type=desc"
req_1 = session.get(url_1, headers=header, cookies=cookies)

req_1.encoding = 'utf-8'
content = req_1.text
p1 = "apps/google-play/app/(.*?)/details/"
pattern1 = re.compile(p1)
print(pattern1.findall(content))

下面数据是我自己想要的数据,你可以根据正则提取你自己想要的数据

转载于:https://www.cnblogs.com/vinzen/p/10181342.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值