在下载的文献中筛选同一作者硕博论文和期刊文献(中文和外文)
背景需求
在进行某一领域的研究中,由于文献数量较少,因此将中文期刊、中文硕博论文和外文期刊都进行整理。但是这种必然会存在一个问题问题:
硕博论文的一个主题(章节)会对应着中文期刊或者外文期刊
因此有必要筛选同一作者硕博论文和期刊文献,对数据集进行处理
问题解决
首先下载的中文期刊和中文硕博论文都是以Endnote的格式导出,而外文期刊是以纯文本的形式导出
借助metaknowledge和自己封装的cnki_to_df函数,将下载到本地的文本文件读入到python环境中
筛选同一作者硕博论文和期刊文献
import pandas as pd
import metaknowledge as mk
from mk_utils import cnki_to_df
journa