#读取文件
raw=pd.read_excel("对应的文件路径"sheet_name="表名")
#获取对应所需要的列名列表,例如这里我需要的是第7列开始的数据,前面的数据不需要
columns=raw.columns[6:]
#建立对应所需要的列表的列表字典
names=dict((column,[])for column in columns)
#进行条件筛选并转换每一列的Dataframe结构为Series方便之后字典直接转换为新的Dataframe
#例如这里我筛选的就是列中值不等于“已完成”的对应的“姓名”这一列的名字,并存入names字典中
for column in columns:
temp=raw.loc[raw[column]!='已完成','姓名']
names[column]=pd.Series(temp.to_numpy())
del temp
#转换为Dataframe格式,并导出excel的xlsx文件
pd.DataFrame(names).to_excel('xxx.xlsx',index=None)
Pandas条件筛选列中的值并导出对应的其他列值
于 2022-11-04 16:42:21 首次发布