微信群解答_各月各旬降水量均值_巧用groupby

通过Python进行数据分析,解决群友需求,计算多年各月各旬的平均降雨量,以评估当前年份的洪涝灾害风险。数据存在缺失,通过分组求和、重置索引、分组计算均值和透视列,得到完整结果。测试发现各月旬值之和等于月均值,揭示我国降水集中在夏秋两季的特征。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在这里插入图片描述
记录一则群友在微信群里提出的需求,计算多年各月各询的平均降雨量。统计这个多年旬月均值,是为了跟当前年份的旬月值做比较,多了就说明当前月份雨水多,有可能发生洪涝灾害。

群友给的这份数据其实并不完整,日期不是连续的,群友解释缺失的日期表示当天没有下雨。

旬 月 值 = ∑ 每 年 各 月 各 旬 降 雨 量 该 旬 出 现 次 数 旬月值=\frac{\sum每年各月各旬降雨量}{该旬出现次数} =

首先我们对数据进行简单的清洗。

# 数据文件比较规整,所以用pd.read_csv直接读取
df = pd.read_csv("./10年数据.txt", sep='\t')

# 将数据列的dt改为日期类型,并提取日期作为行索引
df.index = pd.to_datetime(df['dt'], format='%Y-%m-%d').dt.date

# 补全剩余日期,范围为2006/1/1-2015/9/30,p值默认为0
df = df.reindex(index=pd.date_range(
    start='2006/1/1', end='2015/9/30'), fill_value=0)

# 再一次填补缺失值为0
df.p.fillna(0, inplace=True)

# 删除表中多余的dt列
df.drop('dt', axis=1, inplace=True)

# 日<=10为上旬,0<日
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值