相信有不少人收这个问题的困扰,若是你想一次性在pandas.DataFrame里添加几列,或者在指定的位置添加一列,都会很苦恼找不到简便的方法;能够用到的函数有df.reindex, pd.concathtml
咱们来看一个例子:函数
df 是一个DataFrame, 若是你只想在df的后面添加一列,能够用下面的方法:spa
可是若是你想一次性添加两列级以上,你可能会用通样的办法code
df[['D','E']] == None ,结果报错以下:htm
因此接下来我想介绍两种认为比较简便的方法对象
(1)第一个方法是利用pd.concat 在DataFrame后面添加两列,这种方法的缺点是不能指定位置blog
pd.concat([df, pd.DataFrame(columns=list('DE'))])索引
(2)第二种方法是利用 reindex来重排和增长列名df.reindex(columns=list('ABCDE'))pandas
这种方法,你能够改变各列的相对位置,且保留原始列的数值,好比df.reindex(columns=list('BCADE'))class
reindex 还有 fill_value 选项,能够填充NaN,例子以下df.reindex(columns=list('ABCDE'), fill_value=0)
固然这里举的例子比较简单,在实际运用中,列名可能都比较长,都敲出来确定不方便,因此咱们须要更强大的方法,运用到 list.insert的方法list.insert(index, obj)
参数
index -- 对象obj须要插入的索引位置。
obj -- 要插入列表中的对象。
先获取原列名集合, 赋值给新变量(这个很重要,具体缘由我也不知道为啥), 而后 insert
col_name =df.columns.tolist()
col_name.insert(1,'D')
df.reindex(columns=col_name)
Out[92]:
A D B C01NaNNoneNone13NaNNoneNone
或者不用数字索引,直接在某列前面或后面插入,利用 list.index的方法
col_name=df.columns.tolist()
col_name.insert(col_name.index('B'),'D')#在 B 列前面插入
df.reindex(columns=col_name)
Out[93]:
A D B C01NaNNoneNone13NaNNoneNone
col_name=df.columns.tolist()
col_name.insert(col_name.index('B')+1,'D') #在 B 列后面插入
df.reindex(columns=col_name)
Out[96]:
A B D C
01None NaNNone
13None NaNNone
转自:http://www.th7.cn/Program/Python/201708/1216328.shtml
本文介绍了如何在Pandas DataFrame中高效地添加一列或多列。使用`pd.concat`可以在DataFrame末尾添加列,但无法指定位置。而通过`reindex`方法并结合`insert`,可以灵活地在指定位置插入新列,同时保留原始数据。文中通过实例详细解释了这两种方法的使用方式。
331

被折叠的 条评论
为什么被折叠?



