Pandas DataFrame数据的增、删、改、查

本文详细介绍了使用 Python 的 Pandas 库进行数据增删改查的基本操作方法,包括如何增加行或列、如何选取特定数据、如何修改数据内容以及如何删除不需要的行或列。
该文章已生成可运行项目,

准备工作:

增、删、改、查的方法有很多很多种,这里只展示出常用的几种。

参数inplace默认为False,只能在生成的新数据块中实现编辑效果。当inplace=True时执行内部编辑,不返回任何值,原数据发生改变。


>>> import numpy as np
>>> import pandas as pd

df = pd.DataFrame(data = [['lisa','f',22],['joy','f',22],['tom','m','21']],index = [1,2,3],columns = ['name','sex','age'])#测试数据。
>>> df
   name sex age
1  lisa   f  22
2   joy   f  22
3   tom   m  21

一、增

1.按列增加。

>>> citys = ['ny','zz','xy']
>>> df.insert(0,'city',citys) #在第0列,加上column名称为city,值为citys的数值。
>>> jobs = ['student','AI','teacher']
>>> df['job'] = jobs #默认在df最后一列加上column名称为job,值为jobs的数据。
>>> df.loc[:,'salary'] = ['1k','2k','2k','2k','3k'] #在df最后一列加上column名称为salary,值为等号右边数据。

2.按行增加。

>>> df.loc[4] = ['zz','mason','m',24,'engineer’]#若df中没有index为“4”的这一行的话,该行代码作用是往df中加一行index为“4”,值为等号右边值的数据。若df中已经有index为“4”的这一行,则该行代码作用是把df中index为“4”的这一行修改为等号右边数据。
>>> df_insert = pd.DataFrame({'name':['mason','mario'],'sex':['m','f'],'age':[21,22]},index = [4,5])
>>> ndf = df.append(df_insert,ignore_index = True) #返回添加后的值,并不会修改df的值。ignore_index默认为False,意思是不忽略index值,即生成的新的ndf的index采用df_insert中的index值。若为True,则新的ndf的index值不使用df_insert中的index值,而是自己默认生成。

二、查

1. df['column_name'] 和df[row_start_index, row_end_index] 

df['name']
df['gender']
df[['name','gender']] #选取多列,多列名字要放在list里
df[0:]	#第0行及之后的行,相当于df的全部数据,注意冒号是必须的
df[:2]	#第2行之前的数据(不含第2行)
df[0:1]	#第0行
df[1:3] #第1行到第2行(不含第3行)
df[-1:] #最后一行
df[-3:-1] #倒数第3行到倒数第1行(不包含最后1行即倒数第1行,这里有点烦躁,因为从前数时从第0行开始,从后数就是-1行开始,毕竟没有-0)

2. df.loc[index,column] 

# df.loc[index, column_name],选取指定行和列的数据
df.loc[0,'name'] # 'Snow'
df.loc[0:2, ['name','age']] 		 #选取第0行到第2行,name列和age列的数据, 注意这里的行选取是包含下标的。
df.loc[[2,3],['name','age']] 		 #选取指定的第2行和第3行,name和age列的数据
df.loc[df['gender']=='M','name'] 	 #选取gender列是M,name列的数据
df.loc[df['gender']=='M',['name','age']] #选取gender列是M,name和age列的数据

3.  iloc[row_index, column_index]

df.iloc[0,0]		#第0行第0列的数据,'Snow'
df.iloc[1,2]		#第1行第2列的数据,32
df.iloc[[1,3],0:2]	#第1行和第3行,从第0列到第2列(不包含第2列)的数据
df.iloc[1:3,[1,2]	#第1行到第3行(不包含第3行),第1列和第2列的数据

三、改

3.1 改行列标题。

>>> df.columns = ['name','gender','age'] #尽管我们只想把’sex’改为’gender’,但是仍然要把所有的列全写上,否则报错。
>>> df.rename(columns = {'name':'Name','age':'Age'},inplace = True) #只修改name和age。inplace若为True,直接修改df,否则,不修改df,只是返回一个修改后的数据。
>>> df.index = list('abc')#把index改为a,b,c.直接修改了df。
>>> df.rename({1:'a',2:'b',3:'c'},axis = 0,inplace = True)#无返回值,直接修改df的index。

3.2 改数值

1. 使用loc

>>> df.loc[1,'name'] = 'aa' #修改index为‘1’,column为‘name’的那一个值为aa。
>>> df.loc[1] = ['bb','ff',11] #修改index为‘1’的那一行的所有值。
>>> df.loc[1,['name','age']] = ['bb',11]    #修改index为‘1’,column为‘name’的那一个值为bb,age列的值为11。

2. 使用iloc[row_index, column_index]

>>> df.iloc[1,2] = 19#修改某一无素
>>> df.iloc[:,2] = [11,22,33] #修改一整列
>>> df.iloc[0,:] = ['lily','F',15] #修改一整行

四、删

1.删除行。

>>> df.drop([1,3],axis = 0,inplace = False)#删除index值为1和3的两行,

2.删除列。

>>> df.drop(['name'],axis = 1,inplace = False) #删除name列。
>>> del df['name'] #删除name列。
>>> ndf = df.pop('age’)#删除age列,操作后,df都丢掉了age列,age列返回给了ndf。









本文章已经生成可运行项目
### 如何在 Pandas DataFrame 中执行操作 #### 添加数据DataFrame 可以通过 `append` 方法向现有 DataFrame 追加新行,也可以通过创建新的列来扩展 DataFrame 的宽度。 ```python import pandas as pd # 创建初始 DataFrame df = pd.DataFrame([[1, 2], [3, 4]], columns=['A', 'B']) # 向 DataFrame 添加一行 new_row = {'A': 5, 'B': 6} df = df.append(new_row, ignore_index=True) print("After adding row:") print(df) ``` 要添加一整列,则可以直接赋值给一个新的列名: ```python df['C'] = [7, 8, 9] print("\nAfter adding column C:") print(df) ``` #### 数据 除特定索引位置的行可使用 `drop()` 函数;而移除某列则可通过设置参数 `axis=1` 来实现。 ```python # 除指定索引的行 df = df.drop(0) print("\nAfter dropping index 0:") print(df) # 移除某一列 del df['C'] print("\nAfter deleting column C:") print(df) ``` #### 更新/修数据 更新单个单元格的内容非常简单,只需直接访问并重新分配即可。如果想要批量替换某些条件下的值,可以利用布尔掩码技术。 ```python # 修某个具体位置上的数值 df.at[1,'A']=10 # 使用 loc 或者 at 对多处进行更 mask = (df['A']>5)&(df['B']==6) df.loc[mask,['A','B']] = [11,12] print("\nAfter modifying some values:") print(df) ``` #### 数据 询满足一定条件的数据记录通常借助于布尔索引来完成。这允许基于复杂的逻辑表达式筛选出符合条件的结果子集。 ```python query_result = df[(df.A>2)] print("\nQuery result where A is greater than 2:") print(query_result) ```
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值