将Web of Science非核心合集纯文本导入EndNote工具,Python实现DataFrame转换

465 篇文章 ¥39.90 ¥99.00
本文介绍了如何使用Python将Web of Science非核心合集的纯文本导入EndNote,通过将文本转换为DataFrame进行数据清洗和规范化,提高科研工作者的效率。

将Web of Science非核心合集纯文本导入EndNote工具,Python实现DataFrame转换

在科研工作中,我们经常需要使用Web of Science(WOS)来检索论文和数据。然而,WOS通常会将搜到的文献以非核心合集的方式呈现,这样就会给我们导入到文献管理工具EndNote造成很大的麻烦,从而需要手动一个个进行录入,浪费了我们大量的时间和精力。

那么如何将WOS中的非核心合集的纯文本格式导入到EndNote?本文将为大家分享使用Python实现该功能的方法。

首先,我们需要从WOS中下载非核心合集的信息,这可以通过在WOS中搜索所需内容,然后选择“其他文件格式”中的“纯文本”进行下载得到,得到的文件名为“savedrecs.txt”。

接下来,我们需要将这个文件导入到EndNote中。这可以通过使用EndNote的“导入”功能来完成,但是这种方法通常会遇到一些问题,例如某些字段可能无法正确识别,从而导致文献信息不完整或者错误,还有很多规范化的处理也需要我们自己手动操作。因此,我们需要使用Python将其转换为pandas中的DataFrame类型数据并进行进一步的处理。

首先,我们需要载入需要的库:

import re
import pandas as pd

接下来,我们需要打开“savedrecs.txt”文件,并将其转换为DataF

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值