首先,自行解决网络访问问题,保证能访问到谷歌学术,否则下面可免看
第一步:安装 selenium
python 安装 selenium
pip install selenium
第二步:安装 Chrome 浏览器
第三步:根据 Chrome 版本,下载 Chrome Driver
在设置 - 帮助 - 关于 GoogleChrome 查看版本

然后在这里找对应版本的driver(版本一定要对应)
https://registry.npmmirror.com/binary.html?path=chromedriver/
第四步:整理需要引用的文献
将需要获取的文献题目添加到一个新建的txt文本中:(一行一篇),我新建的文件名字是:pn.txt

第五步:执行如下脚本
注意在if __name__ == "__main__":下修改成你自己的路径 driver_path,input_file_path,output_file_path
driver_path:改成你下载的chrome driver的位置(最好别有中文)
input_file_path:输入文件路径,默认是pn.txt
output_file_path:输出文件路径,默认是output.txt
脚本代码自取:
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from urllib import parse
import math
from time import sleep
class GG_Bibtex(object):
def __init__(self, driver_path, gg_search_url):
self.driver = None
self.paper_names = []
self.gg_search_url = gg_search_url
self.driver_path = driver_path
self.reset(driver_path)
def reset(self, driver_path):
self.service = Se

该文章提供了一个使用Python的selenium库自动化从谷歌学术搜索并提取Bibtex引用的步骤。用户需先确保可以访问谷歌学术,然后安装selenium、Chrome浏览器及对应版本的ChromeDriver。之后,将文献题目放入txt文件,运行提供的Python脚本,脚本会按顺序搜索并保存每篇文献的Bibtex信息到输出文件。
最低0.47元/天 解锁文章
1471





