Zotero-arXiv-Daily跨学科研究支持:同时追踪多个领域的学术进展

Zotero-arXiv-Daily跨学科研究支持:同时追踪多个领域的学术进展

【免费下载链接】zotero-arxiv-daily Recommend new arxiv papers of your interest daily according to your Zotero libarary. 【免费下载链接】zotero-arxiv-daily 项目地址: https://gitcode.com/GitHub_Trending/zo/zotero-arxiv-daily

你是否还在为跨学科研究中需要追踪多个领域的最新文献而烦恼?每天在不同的学术数据库间切换、筛选相关论文耗费大量时间?Zotero-arXiv-Daily 能帮你解决这些问题,只需简单配置,即可自动根据你的 Zotero 图书馆内容,每日推送多个研究领域的相关 arXiv 论文到你的邮箱。读完本文,你将了解如何利用该工具实现跨学科文献的高效追踪与管理,轻松掌握多个领域的学术动态。

🧐 关于Zotero-arXiv-Daily

Zotero-arXiv-Daily 是一款基于 Zotero 图书馆内容,为用户推荐感兴趣的 arXiv 新论文的工具,支持每日自动推送至邮箱。它可以零成本部署为 GitHub Action Workflow,无需安装,只需简单配置 GitHub Action 环境变量即可实现每日自动推送。

logo

该工具的核心功能包括:完全免费,所有计算可在 GitHub Action 运行器本地完成;AI 生成论文摘要(TL;DR),帮助快速筛选目标论文;解析并展示论文作者机构;在邮件中提供 PDF 和代码实现链接(如有);按与用户近期研究兴趣的相关性排序论文列表;通过 Fork 仓库和设置 GitHub Action 环境变量快速部署;支持 LLM API 生成论文摘要;使用 gitignore 风格模式忽略不需要的 Zotero 论文。

✨ 跨学科追踪的核心优势

Zotero-arXiv-Daily 特别适合跨学科研究者,其在多领域学术进展追踪方面具有以下核心优势:

多领域同时监控

通过设置 ARXIV_QUERY 参数,用户可以用“+”号连接多个 arXiv 分类,实现同时监控多个研究领域。例如,cs.AI+cs.CV+cs.LG+cs.CL 可以同时追踪人工智能、计算机视觉、机器学习和计算语言学四个领域的新论文。这一功能对于从事交叉学科研究的人员来说尤为重要,能够帮助他们一站式掌握多个相关领域的最新动态。

个性化推荐

工具会根据用户 Zotero 图书馆的内容,计算论文与用户研究兴趣的相关性,并按相关性排序展示论文列表。这种个性化推荐机制确保了用户能够优先看到与自己研究方向最相关的论文,大大提高了文献筛选的效率。

AI辅助摘要

支持使用 LLM API 生成论文的 TL;DR(Too Long; Didn't Read)摘要,帮助用户快速了解论文核心内容。用户可以设置摘要的语言,默认支持中文,这对于非英语母语的研究者来说非常友好,能够快速把握论文要点,决定是否需要深入阅读。

screenshot

🚀 多领域追踪配置指南

准备工作

在开始配置前,你需要确保拥有以下账号和工具:

  • Zotero 账号:用于提供个人图书馆数据
  • GitHub 账号:用于部署和运行 GitHub Action Workflow
  • 邮箱账号:用于接收每日论文推送

快速开始(GitHub Action 部署)

1. Fork 仓库

首先,访问项目仓库并 Fork(和 Star 🌟)该仓库。Fork 操作可以将项目复制到你的个人 GitHub 账号下,方便你进行个性化配置。

fork

2. 设置 GitHub Action 环境变量

Fork 完成后,进入你 Fork 的仓库,设置 GitHub Action 环境变量。这些变量是工具正常运行所必需的配置信息。

secrets

以下是需要设置的关键环境变量:

Key必需类型描述示例
ZOTERO_IDstrZotero 账号的用户 ID(不是用户名,是一串数字),可从 Zotero 安全设置 获取12345678
ZOTERO_KEYstr具有读取权限的 Zotero API 密钥,可从 Zotero 安全设置 获取AB5tZ877P2j7Sm2Mragq041H
ARXIV_QUERYstr目标 arXiv 论文的分类,用“+”连接多个分类,可从 arXiv 分类列表 查找分类缩写cs.AI+cs.CV+cs.LG+cs.CL
SMTP_SERVERstr发送邮件的 SMTP 服务器地址,需咨询你的邮箱提供商smtp.qq.com
SMTP_PORTintSMTP 服务器端口465
SENDERstr发送邮件的邮箱账号abc@qq.com
SENDER_PASSWORDstr发送邮箱的 SMTP 服务认证密码(不一定是登录密码)abcdefghijklmn
RECEIVERstr接收论文的邮箱地址abc@outlook.com

除了上述必填变量外,还有一些可选变量可以根据需要设置,例如 MAX_PAPER_NUM(邮件中展示的最大论文数量)、USE_LLM_API(是否使用 LLM API 生成摘要)、LANGUAGE(摘要语言)等。

此外,还可以设置一些公共变量(Repository Variables),如 ZOTERO_IGNORE(gitignore 风格的 Zotero 集合忽略规则)、REPOSITORY(提供工作流的仓库)等。

repo_var

3. 测试工作流

完成环境变量设置后,你可以手动触发工作流进行测试。测试工作流是主工作流(Send-emails-daily)的调试版本,无论日期如何,它都会检索 5 篇 arXiv 论文,方便你验证配置是否正确。

test

测试完成后,检查工作流日志和接收邮件,确认一切正常。默认情况下,主工作流每天在 UTC 时间 22:00 自动触发,你也可以通过编辑工作流配置文件 .github/workflows/main.yml 来更改触发时间。

本地运行与 Docker 部署

如果你希望在自己的服务器上运行,或者对资源控制有更高要求,可以选择本地运行或 Docker 部署方式。

本地运行

本地运行需要安装 uv(一种 Python 包管理器),然后设置环境变量并运行主程序:

# 设置所有环境变量
# export ZOTERO_ID=xxxx
# ...
cd zotero-arxiv-daily
uv run main.py

[!IMPORTANT] 工作流将在本地部署一个 LLM(Qwen2.5-3B,文件大小约 3G),请确保你的网络和硬件能够支持。

Docker 部署

Docker 部署适合喜欢容器化部署的用户,具有更好的资源控制、环境管理和日志持久化等优势。

  1. 克隆仓库:
git clone https://gitcode.com/GitHub_Trending/zo/zotero-arxiv-daily.git
cd zotero-arxiv-daily
  1. 构建 Docker 镜像:
docker build . -t local/zotero-arxiv-daily:latest
  1. 创建必要目录:
mkdir -p logs models
  1. 编辑 docker-compose.yml 文件配置环境变量,然后启动服务:
docker compose up -d

Docker 部署支持定时执行(默认每天早上 8:00 运行,可在 command 部分配置 cron 表达式更改时间)、日志持久化(保存在 logs/ 目录)、模型缓存(本地 LLM 模型缓存在 models/ 目录)等功能。

🔧 多领域追踪高级配置

自定义 arXiv 查询

ARXIV_QUERY 参数支持灵活配置多个研究领域。例如,如果你同时关注人工智能、量子计算和生物信息学,可以将 ARXIV_QUERY 设置为 cs.AI+quant-ph+q-bio.BM。你可以在 arXiv 分类列表 中查找所需领域的分类缩写,自由组合形成符合自己研究需求的查询。

忽略特定 Zotero 集合

通过设置 ZOTERO_IGNORE 变量(Repository Variables),你可以使用 gitignore 风格的模式标记需要忽略的 Zotero 集合。例如,设置为“AI Agent/
**/survey
!LLM/survey”可以忽略“AI Agent/”下的所有论文、所有“survey”子集合,但不忽略“LLM/survey”集合。这有助于排除不相关的文献,使推荐更加精准。

LLM 摘要配置

工具支持使用云端 LLM API 或本地 LLM 生成论文摘要。如果设置 USE_LLM_API=1,则使用云端 LLM API,需要同时配置 OPENAI_API_KEY、OPENAI_API_BASE 和 MODEL_NAME 等变量。例如,使用 SiliconFlow 提供的免费 API 时,可设置 MODEL_NAME=Qwen/Qwen2.5-7B-Instruct。如果设置 USE_LLM_API=0,则使用本地 LLM,适合对隐私要求较高或网络条件有限的用户。

📝 使用效果与案例

小明是一名从事人工智能与生物信息学交叉研究的博士生,他需要同时关注人工智能领域的新模型和生物信息学领域的新算法。使用 Zotero-arXiv-Daily 后,他在 ARXIV_QUERY 中设置了 cs.AI+q-bio.BM,每天都会收到这两个领域与他研究兴趣相关的新论文。AI 生成的中文摘要帮助他快速了解论文核心内容,节省了大量筛选文献的时间,让他能够更专注于研究本身。

📌 注意事项与限制

  • 推荐算法:目前的推荐算法基于论文摘要嵌入的相似度计算,可能不能完全准确反映用户兴趣,欢迎提出改进建议。
  • GitHub Action 资源限制:GitHub Action 运行器有资源配额(公共仓库每次执行限制 6 小时,每月 2000 分钟),高 MAX_PAPER_NUM 可能导致执行时间过长。对于公共仓库,个人使用通常足够;如有特殊需求,可考虑本地部署或使用自托管的 GitHub Action 运行器。
  • arXiv 论文发布时间:周末和节假日通常没有新的 arXiv 论文发布,此时主工作流日志中可能会显示“No new papers found”。

🌟 总结与展望

Zotero-arXiv-Daily 为跨学科研究者提供了一种高效、便捷的多领域学术进展追踪解决方案。通过简单的配置,即可实现基于个人研究兴趣的每日论文推荐,支持多领域同时监控、个性化推荐、AI 辅助摘要等功能。无论是使用 GitHub Action 零成本部署,还是本地/Docker 部署,都能满足不同用户的需求。

未来,项目计划进一步优化推荐算法,增加更多自定义过滤规则,支持更多类型的学术数据库,为跨学科研究者提供更全面的学术追踪服务。

如果你觉得这个工具对你的研究有帮助,欢迎点赞👍、收藏⭐、关注项目仓库,以便获取最新更新。如有任何问题或建议,也欢迎提交 issue 或 PR 参与项目贡献!

【免费下载链接】zotero-arxiv-daily Recommend new arxiv papers of your interest daily according to your Zotero libarary. 【免费下载链接】zotero-arxiv-daily 项目地址: https://gitcode.com/GitHub_Trending/zo/zotero-arxiv-daily

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值