题目:两张excel表,学生信息。excel1为总表,excel2为附表,与excel1中有重复,要实现在excel1中去掉与excel2中学号相同的学生,并把处理完的学生按学院分开。
利用pandas进行处理
代码如下:
1.读入 pd.read.excel
2.表中有确实值需要删除 dropna
3. tolist()数组/矩阵转成列表
import pandas as pd
data1 = pd.read_excel('excel1.xlsx')
data2 = pd.read_excel('excel2.xls')
# data2前5行缺失,可以删除
data2.dropna(axis=0,how='all', inplace=True) #axis=0按行删除,1按列删除 any’,表示该行/列只要有一个以上的空值,就删除该行/列;‘all’,表示该行/列全部都为空值,就删除该行/列。
# 分别统计出两张表中出现的人名
name1 = data1['学工号'].values.tolist()#代表学号 # tolist()数组/矩阵转成列表
#print(name1)
name2 = data2['zjh'].values.tolist()#代表学号
# 求两个列表交集
name_same = [i for i in name1 if i in name2]
# 在data1