python爬虫:新冠疫情累计确诊数据爬取及数据可视化
一、数据爬取与整理
1.1 数据来源:丁香园网站
1.2 爬取思路:
使用requests包发送get请求,获取响应的html页面(返回值类型为str)
扫描字符串使用正则表达式匹配出描述国内数据的html语句
去除多余字符并将匹配后结果整理成json文件
1.3 代码展示及文件说明:
import json
import re
import requests
import datetime
today = datetime.date.today().strftime('%Y%m%d')
def c
原创
2020-06-02 17:29:33 ·
9216 阅读 ·
0 评论