一、先看一下效果
获取的全国疫情数据:

可视化后的效果:




二、环境以及模块
环境
- python3.8
- pycharm2021
模块
- json
- requests 爬虫当中 发送网络请求
- pandas 表格处理 / 保存数据
- pyecharts 可视化
三、爬虫(采集网络当中数据 文本 图片 视频 音频)流程:
1. 明确需求
我们要爬取的内容是什么?
分析数据从哪里来的 https://news.qq.com/zt2020/page/feiyan.htm#/
用开发者工具 进行抓包(数据包)分析
2. 代码流程
- 发送请求 访问网站 https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5&_=1638361138568
- 获取数据
- 解析数据
- xpath css re json bs4(过时了)
- json 在python语言当中 字典类型数据 {键1:值1, 键2:值2, 键3:值3}
- 保存数据
3.数据分析 数据可视化
四、代码
1.获取数据,保存数据
import requests # 发送网络请求模块
import json
import pprint # 格式化输出模块
import pandas as pd # 数据分析当中一个非常重要的模块
url = 'https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5&_=1638361138568'
# 1. 发送请求
response = requests.get(url, verify=False)
# <Response [200]>: 响应体Response 200: 状态码 发送请求成功
# 2. 获取数据
json_data = response.json()['data']
# 3. 解析数据
# json_data 什么类型?
json_data = json.loads(json_data)
china_data = json_data['areaTree'][0]['children'] # 列表
data_set = []
for i in china_data:
data_dict

最低0.47元/天 解锁文章
3177

被折叠的 条评论
为什么被折叠?



