【python】dataframe取行列、添加行列汇总

原创已于 2023-08-13 23:11:09 修改 · 8.2k 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#python

于 2022-02-28 23:10:01 首次发布

本文详细介绍了Pandas库中DataFrame对象的选择和添加操作，包括使用点属性和类字典属性选取列，通过索引和切片选取行，以及利用loc和iloc进行精确选取。此外，还讲解了如何添加新行和新列，如使用loc插入行，通过赋值创建新列，以及append和concat方法。内容涵盖了数据操作的基础和进阶技巧。

【取行列】

data是一个dataframe


data['w']  #选择表格中的'w'列，使用类字典属性,返回的是Series类型

data.w    #选择表格中的'w'列，使用点属性,返回的是Series类型

data[['w']]  #选择表格中的'w'列，返回的是DataFrame属性

data[['w','z']]  #选择表格中的'w'、'z'列

data[0:2]  #返回第1行到第2行的所有行，前闭后开，包括前不包括后

data[1:2]  #返回第2行，从0计，返回的是单行，通过有前后值的索引形式，
       #如果采用data[1]则报错

data.ix[1:2] #返回第2行的第三种方法，返回的是DataFrame，跟data[1:2]同

data['a':'b']  #利用index值进行切片，返回的是**前闭后闭**的DataFrame, 
        #即末端是包含的  
data.irow(0)   #取data的第一行
data.iloc[:, 0]   #取data的第一列

data.head()  #返回data的前几行数据，默认为前五行，需要前十行则dta.head(10)
data.tail()  #返回data的后几行数据，默认为后五行，需要后十行则data.tail(10)

ser.iget_value(0)  #选取ser序列中的第一个
ser.iget_value(-1) #选取ser序列中的最后一个，这种轴索引包含索引器的series不能采用ser[-1]去获取最后一个，这回引起歧义。

data.iloc[-1]   #选取DataFrame最后一行，返回的是Series
data.iloc[-1:]   #选取DataFrame最后一行，返回的是DataFrame
df.loc['a']   # 取‘a’行，返回类型是Series
df.loc[['a']]   # 取‘a’行，返回类型是DataFrame

data.loc['a',['w','x']]   #返回‘a’行'w'、'x'列，这种用于选取行索引列索引已知

data.iat[1,1]   #选取第二行第二列，用于已知行、列位置的选取。

【添加行列】

1、添加行

data.loc[0]=['cat', 3]   #在第0行插入cat行，值为3

data1.append(data2)   #直接append


data.concat
data.merge  #看场合

2、添加列

data['new column'] = [1,2,3,4]

insert方法不常用