pandas 根据筛选条件对指定excel列进行筛选
这两天老师要求筛选一下最近几年学院发表的文章,从图书馆那要了份数据量较大的excel,将该excel分成学生文章、老师文章两份excel,以第一作者为区分,B站学习法稍微补了补python操作excel,看到pandas就顺手用一下了……大佬勿喷,仅仅是稍微学了一下。
导入需要筛选的excel和筛选条件
import pandas as pd
df = pd.read_excel('D:/py_project/datafenxi/scut.xls',sheet_name='savedrecs')
ji_he = {
'name1','name2','name3',任意多个name}
这里的ji_he是提供的学院所有老师的姓名,与下面的要筛选的表格A做匹配,标记出A中一作为老师的论文。那剩下的未标记就是学生。
要筛选的表格A
excel内容大概长这样(对不起!杰伦力宏紫棋):
ID | Author Full Names | 发了什么期刊、日期等等 |
---|---|---|
0 | Zhou, Jielun;Peng, Yuyan;Li, Bai;Xiu, Er | xxx |