目录
(2)各年AQI折线图、AQI直方图、PM2.5与AQI散点图、空气质量整体情况的饼图
一、实验内容
对《北京市空气质量》数据进行数据分析。其中包括数据的导入、预处理、可视化。
二、完成情况
1.完成了《北京市空气质量的数据分析》
2.敲试了听课ppt上的代码,由于内容较多,放于实验报告最后的【附录】部分
三、数据分析
1.问题描述
根据《北京市空气质量》的excel数据对今年北京市空气质量进行分析
2.编程思路
(1)首先导入数据,利用pandas库进行导入
(2)其次进行数据预处理,主要针对异常值,找到后用NAN替代
(3)绘制2014年-2019年AQI时间序列折线图,从空气质量指数的折线图直观地看2014年-2019年北京市空气质量的变化
(4)绘制各年AQI折线图,观看2014-2019年AQI均值的变动情况;绘制AQI直方图,看2014年-2019年AQI的分布;绘制PM2.5与AQI的散点图,分析PM2.5对AQI的影响;绘制质量等级的饼图,观看各个等级所占的比例
(5)在原有代码的基础上又编写了绘制六种空气成分与AQI的散点图,分析各个成分对AQI的影响
3.程序代码
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt#matplotlib的Pyplot子模块,指定别名为plt
#%matplotlib inline
#将matplotlib的图表直接嵌入到Notebook之中,或者使用指定的界面库显示图表,它有一个参数指定matplotlib图表的显示方式。inline表示将图表嵌入到Notebook中。
#Python提供了许多魔法命令,使得在IPython环境中的操作更加得心应手。魔法命令都以%或者%%开头,以%开头的成为行命令,%%开头的称为单元命令。行命令只对命令所在的行有效,而单元命令则必须出现在单元的第一行,对整个单元的代码进行处理。
#执行%magic可以查看关于各个命令的说明,而在命令之后添加?可以查看该命令的详细说明。
plt.rcParams['font.sans-serif']=['SimHei'] #解决中文显示乱码问题
plt.rcParams['axes.unicode_minus']=False
data=pd.read_excel('D:\个人成长\学业\课程\python\实验\题目\北京市空气质量数据.xlsx') #要注意路径
#指定立即显式所绘图形,且通过参数设置解决图形中文显示乱码问题
data.isnull()
data=data.replace(0,np.NaN)
plt.figure(figsize=(10,5))
#利用函数plt.figure说明图形的一般特征,如这里指宽10高5
plt.plot(data['AQI'],color='black',linestyle='-',linewidth=0.5)
#利用函数plt.plot绘制序列折线图,同时指定折线颜色、线性、线宽等
plt.axhline(y=data['AQI'].mean(),color='red', linestyle='-',linewidth=0.5,label='AQI总平均值')
#在参数y指定位置上画一条平行于横坐标的直线,并给定直线图例文字
#plt.axvline在参数x指定位置上画一条平行于纵坐标的直