用Python爬虫获取今日全国高温Top10

本文通过Python爬虫分析中国天气网获取全国各省份省会城市的高温数据,并利用pyecharts绘制折线图展示最高气温Top10。首先分析网站HTML结构,接着遍历七大区域获取数据,最后使用pyecharts更新版1.1.0进行数据可视化,展示了西安等城市的高温情况。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

热出天际

今天全国到底有多热暂时不知道,反正我大西安今天是热出天际了!
还没入伏就能有这样的温度,各大空调厂商是给老天送了多少供奉啊…
之前做天气预报自动推送小工具的时候,爬过**中国天气网**,今天就再盘它一次,来看看全国天气吧
首先进入中国天气网,有一个国内天气预报的栏目:
国内天气预报.png

如上图所示,网站将中国分为:
华为、东北、华南、西北、西南、华东、华中、港澳台及大地域,西安属于西北,进去看看:
西安天气.png

看到这温度,我就想到了小岳岳的那句**我的天哪...!**
咱们来分析下这张图,每个省的第一个诚实都是省会城市,省内的温度差别不大,那我们就把全国每个省会城市的温度进行比较吧,至于港澳台…我选择直接忽视。

网站分析

网站html分析

网站html代码.png

  • 每日天气
    <div class="conMidtab">
    conMidtab一共有7个,后6个添加了隐藏样式**style="display:none;"**,是后6天的天气预报,咱们只关心第一个即可…
  • 各省天气
    <div class="conMidtab2">
    每个省份的数据都包过在这个div中,只要findAll即可
  • 省会城市
    <tr style="background-color: rgb(255, 255, 255);">
    表格中的前两个tr应该用th做标题的,所以从第三个tr就是省会城市的温度信息了
  • 数据获取
    省会城市名称、最高温度、最低温度 分别在1、4、7的td中,findALL后,这么规律的排序直接使用列表切片[1:8:3]即可获取
数据汇总分析

刚才分析了西北地区的数据获取,然后再看看西南。
西北地域的数据url为:
http://www.weather.com.cn/textFC/xb.shtml
再看看西南地域的url:
http://www.weather.com.cn/textFC/xn.shtml
简直不要太欢乐,url只有最后的地域拼音头不一样,可以开启for循环模式了!
遍历7个地域,然后获取每个地域下的省会城市,最终保存到一个列表中,样式大致如下:
预处理数据.png

数据展示

数据趴好了,返回一串数组?这怎么符合处女座追求完美的行事风格!
python绘图的模块很多,多数人都用Matplotlib,但是…

渣男锡纸烫,渣女大波浪,而我不一样,积极又向上。

所以不一样的我使用pyecharts…
今天用pyecharts绘图,让大家看看python集成echarts后的绘图效果如何。
既然是温度排行当然要用折线图了,然后绘图给大家展示下全国今日气温最高的省会城市Top10,走起…

代码实现

模块准备

如果你是首次使用爬虫和echarts绘图,需要关注一下模块的安装:

pip install requests
install beautifulsoup4
pip install lxml # bs4的解析依赖库
pip install pyecharts
关于pyecharts的更新

网上铺天盖地的pycharts都是来回转来转去的0.3.x、0.5.x的版本
pyecharts 19年4月份已经更新到1.1.0了,其中不管是模块导入还是插件的使用,变更都比较大。
所以网上的那列介绍,如果是python3.6+你就别看了,不适合你,连代码引入都会报错。
有人说可以指定旧版本啊,可既然出了新版本,你又何必杠精的去学习旧的版本?
看看pyecharts的github:https://github.com/pyecharts/pyecharts

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值