1. 汇总类统计
2. 唯一去重和按值计数
3. 相关系数和协方差
import pandas as pd
0 . 读取csv数据
file_path = r'C:\TELCEL_MEXICO_BOT\A\Weather.csv' df = pd.read_csv(file_path,encoding='utf-8') print(df.head()) #查看前5行数据 ymd bWendu yWendu tianqi fengxiang fengji aqi aqiInfo aqiLevel 0 1/1/2025 -25°C -6°C 晴~多云 西北风 1-2级 59 优 2 1 1/2/2025 2°C -9°C 阴 东南风 3-4级 48 优 1 2 1/3/2025 -11°C -2°C 晴~多云 西风 4-8级 28 良 1 3 1/4/2025 0°C -4°C 晴~多云 东风 2-5级 30 良 1 4 1/5/2025 3°C -1°C 小雨 东风 3-5级 25 良 1
!! 注意:
前面几节都是使用df.loc[:,'bWendu'] = df['bWendu'].str.replace('°C','').astype('int32')来进行数据替换,这种方法结果没有影响,但会有两条 DeprecationWarning,提示在未来的 Pandas 版本中,df.iloc[:, i] = newvals的行为会发生变化.
所以稍微做了变动,去掉了:,其它代码不变,结果一样。可以理解为选择了bWendu这一列数据进行修改
df['bWendu'] = df['bWendu'].str.replace('°C','').astype('int32')
df['yWendu'] = df['yWendu'].str.replace('°C','').astype('int32')
print(df.head()) bWendu yWendu tianqi fengxiang fengji aqi aqiInfo aqiLevel ymd 1/1/2025 -25 -6 晴~多云 西北风 1-2级 59 优 2 1/2/2025 2 -9 阴 东南风 3-4级 48 优 1 1/3/2025 -11 -2 晴~多云 西风 4-8级 28 良 1 1/4/2025 0 -4 晴~多云 东风 2-5级 30 良 &nb

最低0.47元/天 解锁文章
1752

被折叠的 条评论
为什么被折叠?



