数据分析 -- 成都天气分析（2011-2019）

最新推荐文章于 2024-07-01 08:38:21 发布

天山下小花家

最新推荐文章于 2024-07-01 08:38:21 发布

阅读量1.2k

点赞数 4

分类专栏：数据分析文章标签： python 可视化

本文链接：https://blog.youkuaiyun.com/XiaoMaEr66/article/details/104120520

版权

本文通过对2011年至2019年成都天气数据的获取、处理、清洗和分析，展示了气温的整体情况和变化幅度，按月的温度分布，不同天气类型的统计，以及风向等信息。特别指出雨天减少、阴天增加的趋势，暗示成都空气湿度可能下降，生活环境更加宜人。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1 数据获取

import requests
from lxml import etree
import json
import time

class ChengduClimate:
	def __init__(self):
		self.headers = {
   "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.120 Safari/537.36"}

	def parse_url(self,url):
		print(url)
		response = requests.get(url,headers=self.headers)
		return response.content

	def get_content_list(self,html_str):#提取数据
		html = etree.HTML(html_str)
		li_list = html.xpath("//ul[@class='lishitable_content clearfix']/li")
		content_list =[]
		for li in li_list[:-1]:
			item = {
   }
			item["date"] = li.xpath("./div/text()")[0] if len(li.xpath("./div/text()"))>4 else li.xpath("./div/a/text()")[0]
			item["max_temperture"] = li.xpath("./div[2]/text()")[0] if len(li.xpath("./div[2]/text()"))>0 else None
			item["min_temperture"] = li.xpath("./div[3]/text()")[0] if len(li.xpath("./div[3]/text()"))>0 else None
			item["weather"] = li.xpath("./div[4]/text()")[0] if len(li.xpath("./div[4]/text()"))>0 else None
			item["wind_direction"] = li.xpath("./div[5]/text()")[0].strip() if len(li.xpath("./div[5]/text()"))>0 else None
			content_list.append(item)
			print(item)

		return content_list


	def save_content_list(self,content_list):
		with open("chengdu tianqi.txt","a",encoding="utf-8") as f:
			for content in content_list:
				f.write(json.dumps(content,ensure_ascii=False))
				f.write("\n")
		print("保存成功")

	def run(self):
		for i in range