1、将Fiddler配置完成,夜神模拟器中下载所需要的APP,然后使用Fiddler来获取所需数据的“url”和“headers”。例如下图:
2、学会如何获取数据,并打印出数据。
首先我们先找到url和headers,然后使用get来获取数据,使用到了requests这个库的get()方法,通过r=request.get(url)构造一个向服务器请求资源的url对象。然后可以尝试打印出文本,如下图所示:
import requests
import json
from urllib.request import urlretrieve
import pprint
url='http://111.75.227.199:8084/api/CityData/GetHourData?cityCode=360300&StationTypeID='#3
headers={
'Host':'111.75.227.199:8084',
'Connection': 'Keep-Alive',
'Accept-Encoding': 'gzip',
'User-Agent': 'okhttp/3.7.0',
}
response = requests.get(url=url,headers=headers)
print(response.text)
再可以转化成json,输出之后如下图所示:
data = response.json()
#打印标准的json数据
pprint.pprint(data)
3、找到自己所需要的数据:转化为json类型的数据之后,会发现这就有点像数组一样。例如找到以下的数据,需要逐步尝试准确的找到数据的位置。
print(data['StationList'][0])
4、如何将数据写入csv文件中:
import csv
multi_dimensional_list=[1,2,3,4,5]
if __name__ == '__main__':
f = open("hour.csv", 'a',newline='',encoding='utf-8')
writer = csv.writer(f)
writer.writerow(multi_dimensional_list)
f.close()
同理可得,可以将爬取出来的数据写入csv文件当中。