去掉两张excel表中相同的行

最新推荐文章于 2025-04-02 16:59:39 发布

Killwaiter

最新推荐文章于 2025-04-02 16:59:39 发布

阅读量615

点赞数

分类专栏： excel 文章标签： excel

本文链接：https://blog.youkuaiyun.com/zhangxue1232/article/details/118609947

版权

这篇博客介绍如何利用Pandas库在Python中处理Excel文件，具体操作是将Excel1（总表）中与Excel2（附表）学号相同的学生信息删除，并按学院对剩余学生进行分组。通过读取Excel文件、删除含有缺失值的行，以及将数据转换为列表来实现这一目标。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

题目：两张excel表，学生信息。excel1为总表，excel2为附表，与excel1中有重复，要实现在excel1中去掉与excel2中学号相同的学生，并把处理完的学生按学院分开。

利用pandas进行处理

代码如下：

1.读入 pd.read.excel

2.表中有确实值需要删除 dropna

3. tolist()数组/矩阵转成列表

import pandas as pd

data1 = pd.read_excel('excel1.xlsx')
data2 = pd.read_excel('excel2.xls')


# data2前5行缺失，可以删除
data2.dropna(axis=0,how='all', inplace=True) #axis=0按行删除，1按列删除  any’，表示该行/列只要有一个以上的空值，就删除该行/列；‘all’，表示该行/列全部都为空值，就删除该行/列。

# 分别统计出两张表中出现的人名
name1 = data1['学工号'].values.tolist()#代表学号  # tolist()数组/矩阵转成列表
#print(name1)
name2 = data2['zjh'].values.tolist()#代表学号

# 求两个列表交集
name_same = [i for i in name1 if i in name2]  

# 在data1

最低0.47元/天解锁文章