2021-01-10

博客介绍了np.random.seed(arg)函数,其中arg代表随机数的起始位置,还给出了相关博客链接https://www.cnblogs.com/subic/p/8454025.html 。
你提供的数据是一个典型的空气质量监测数据集,包含日期、AQI 和多种污染物浓度以及污染等级。我们可以基于此数据进行统计分析、可视化或模型训练等操作。 以下是一些可以执行的常见任务和示例代码: --- ### ✅ 1. 数据加载与查看 ```python import pandas as pd # 假设你的数据存储在一个 CSV 文件中 data = pd.read_csv("air_quality_data.csv") # 查看前几行数据 print(data.head()) ``` --- ### ✅ 2. 按污染等级分组统计污染物均值 ```python grouped_stats = data.groupby('污染等级').agg({ 'PM2.5': 'mean', 'PM10': 'mean', 'CO': 'mean', 'NO2': 'mean', 'SO2': 'mean', 'O3_8h': 'mean' }).reset_index() print(grouped_stats) ``` --- ### ✅ 3. 绘制箱线图(Boxplot)比较不同污染等级下的污染物分布 ```python import matplotlib.pyplot as plt import seaborn as sns pollutants = ['PM2.5', 'PM10', 'CO', 'NO2', 'SO2', 'O3_8h'] fig, axes = plt.subplots(2, 3, figsize=(16, 10), dpi=100) axes = axes.flatten() for i, pollutant in enumerate(pollutants): sns.boxplot(x='污染等级', y=pollutant, data=data, ax=axes[i], palette="Set2") axes[i].set_title(f'{pollutant} 分布') axes[i].tick_params(axis='x', rotation=45) plt.tight_layout() plt.show() ``` --- ### ✅ 4. 进行显著性检验(ANOVA 或 Kruskal-Wallis) ```python from scipy.stats import f_oneway, kruskal for pollutant in pollutants: groups = [group[pollutant].values for name, group in data.groupby('污染等级')] # 正态性检验(可选) normality_results = [stats.normaltest(group) for group in groups] p_values_normal = [p for stat, p in normality_results] if all(p > 0.05 for p in p_values_normal): f_stat, p_val = f_oneway(*groups) print(f"污染物 {pollutant}: ANOVA p-value = {p_val:.4f}") else: h_stat, p_val = kruskal(*groups) print(f"污染物 {pollutant}: Kruskal-Wallis p-value = {p_val:.4f}") ``` --- ###
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值