简单介绍
在进行数据分析时,经常需要按照一定条件创建新的数据列,然后进行一步一步分析,常用的有四种新增数据列
1.直接赋值
2.df.apply
3.df.assign
4.按条件选择分组分别赋值
读取csv数据到dataFrame
数据如下
ymd,bWenDu,yWenDu,tianQi,fengXiang,fengJi,aqi,aqiInfo,aqLevel
2018-01-01,3°C,-5°C,🌤,东北风,1-2级,59,良,2
2018-02-22,6°C,-4°C,☀,西南风,2-3级,66,良,1
2018-02-03,4°C,-5°C,☼,西风,5-6级,39,优,1
2018-04-05,5°C,-2°C,☂,北风,1-2级,43,优,1
2019-02-01,2°C,-6°C,☁,南风,1-2级,27,良,2
2019-10-23,3°C,-1°C,🌤,东风,1-2级,18,良,2
读取代码
import pandas as pd
fpath = "../data/tianqi.csv"
df = pd.read_csv(fpath)
print(df.head())
直接赋值方法
案例:计算温差
# 处理数据,先将温度后缀去掉,变成数字类型
df.loc[:, "bWenDu"] = df["bWenDu"].str.replace

最低0.47元/天 解锁文章
8299

被折叠的 条评论
为什么被折叠?



