工作中我们时常会根据现有DataFrame的一些字段去创建新的字段,刚开始的时候,我的做法大多数是按照下面模式:
df[‘new_col’] = df.col.apply(lambda x: x …)
去创造新的字段,其实还有其他的好的一些做法。
下面我介绍下pandas的一些技巧去提高处理此类问题的效率。
-
利用’assign’函数一次性创建多个字段:

下面可以看到,我不仅可以在现有字段上创建新的字段(beer_price, beer_onces),同时我们还能在刚刚创建的新字段中再次创造新的字段(beer_gallons)。

-
利用函数根据现有字段创建一串类似名字的字段:
for col in df.columns:
df[f’{col}_new’] = df[col].apply(my_function)

3.在特定的位置插入新的一列:
在country_fixed后面插入新的一列

本文介绍了Pandas中提高效率的技巧,包括使用`assign`函数一次性创建多个字段,通过for循环结合现有字段生成类似名字的新字段,以及在指定位置插入新列的方法,帮助优化DataFrame操作。
最低0.47元/天 解锁文章
554

被折叠的 条评论
为什么被折叠?



