在下载的文献中筛选同一作者硕博论文和期刊文献(中文和外文)
背景需求
在进行某一领域的研究中,由于文献数量较少,因此将中文期刊、中文硕博论文和外文期刊都进行整理。但是这种必然会存在一个问题问题:
硕博论文的一个主题(章节)会对应着中文期刊或者外文期刊
因此有必要筛选同一作者硕博论文和期刊文献,对数据集进行处理
问题解决
首先下载的中文期刊和中文硕博论文都是以Endnote的格式导出,而外文期刊是以纯文本的形式导出
借助metaknowledge和自己封装的cnki_to_df函数,将下载到本地的文本文件读入到python环境中
筛选同一作者硕博论文和期刊文献
import pandas as pd
import metaknowledge as mk
from mk_utils import cnki_to_df
journal = cnki_to_df
本文介绍如何在科学研究中处理中文期刊、中文硕博论文和外文期刊的文献数据,通过Endnote和文本文件读取,使用Python的metaknowledge库与自定义函数进行数据处理。重点在于筛选同一作者的文献,首先对比中文文献作者信息,然后通过转换中文姓名为拼音来匹配外文期刊,最终核实并排除重名情况,确保数据准确性。
订阅专栏 解锁全文
1136

被折叠的 条评论
为什么被折叠?



