前言
上文我更新了精确到省一级的新冠疫情历史数据,然后许多网友提出了获取全国市一级和全球的新冠疫情历史数据。现在终于有时间了,我先后获取全球和精确到市一级的疫情数据,本篇博文就先介绍获取市的新冠疫情历史数据。需要事先声明的是,我分析了几个新冠疫情的网站,发现并没有完整的精确到市的历史数据。所以我综合了丁香园和腾讯网的疫情历史数据得到了两份数据,这两份数据都有缺陷。一份是从疫情开始截止到2020年3月初的疫情数据,但是只有全国六十九个市的数据。另一份有全国所有市的数据,但是这些数据并不是从疫情开始到2020年3月初的数据,每个市的数据完整度都不一样,合计下来所有市的数据大约有二十多万条。下面我就介绍获取过程
数据获取
前面也提到过精确到市一级的数据来自于丁香园和腾讯网,丁香园中想要获取历史数据,分析网站的‘script’标签部分。其中展示了全球、全国乃至市的当下新冠疫情历史数据。仔细分析便会找到每个地区对应的静态数据链接,此链接便是该地区对应的新冠疫情历史数据的接口。通过该接口便可获取数据。至于腾讯网的历史数据的获取则主要是通过“https://api.inews.qq.com/newsqa/v1/query/pubished/daily/list?province=省份&city=市名”可获取每个省对应市的历史数据。不过使用该接口需要找到全国34个省中每个省依次对应的市名传入便可得到相应的数据包。
以上便是数据的获取方法,网友们可根据自己的需要自行获取。我数据获取后的Excel表格如下:
该数据在数据库中的形式如下:
可以清晰的看到这69个市的数据有五万两千多条。