开源项目教程:AI论文评审器(Paper Reviewer)

开源项目教程:AI论文评审器(Paper Reviewer)

paper-reviewer Generate a comprehensive review from an arXiv paper, then turn it into a blog post. This project powers the website below for the HuggingFace's Daily Papers (https://huggingface.co/papers). paper-reviewer 项目地址: https://gitcode.com/gh_mirrors/pa/paper-reviewer

1. 项目目录结构及介绍

AI论文评审器项目的目录结构如下:

paper-reviewer/
├── .github/
├── .gitignore
├── LICENSE
├── README.md
├── assets/
├── configs/
├── pipeline/
├── templates/
├── test_assets/
├── collect-hf-linux.sh
├── collect-hf-macos.sh
├── collect.py
├── convert-hf-linux.sh
├── convert-hf-macos.sh
├── convert-local.sh
├── convert.py
├── convert_utils.py
├── cover.png
├── figures.json
├── helper.py
├── html_parse.py
├── r2_utils.py
├── requirements.txt
├── tables.json
├── test_coord.py

目录说明:

  • .github/:存放与GitHub相关的配置文件。
  • .gitignore:指定Git忽略的文件和目录。
  • LICENSE:项目的开源协议文件,本项目采用Apache-2.0协议。
  • README.md:项目的说明文件,介绍了项目的目的和使用方法。
  • assets/:存放项目所需的静态资源,如图像文件等。
  • configs/:包含项目的配置文件。
  • pipeline/:可能包含项目处理流程的相关脚本或模块。
  • templates/:存放项目使用的模板文件,如HTML模板等。
  • test_assets/:存放测试所需的资源文件。
  • collect-hf-linux.shcollect-hf-macos.sh:用于在Linux和macOS系统中收集论文信息的脚本。
  • collect.py:主要的Python脚本,用于收集和生成论文评审。
  • convert-hf-linux.shconvert-hf-macos.sh:用于在Linux和macOS系统中转换评审为博客文章的脚本。
  • convert-local.sh:本地转换评审为博客文章的脚本。
  • convert.py:Python脚本,用于将收集到的评审转换为博客文章。
  • convert_utils.py:转换工具的Python模块。
  • cover.png:项目的封面图像。
  • figures.json:存储图像信息的JSON文件。
  • helper.py:辅助功能的Python模块。
  • html_parse.py:解析HTML的Python模块。
  • r2_utils.py:与R2服务相关的工具模块。
  • requirements.txt:项目依赖的Python包列表。
  • tables.json:存储表格信息的JSON文件。
  • test_coord.py:测试坐标的Python脚本。

2. 项目的启动文件介绍

项目的启动主要依赖于collect.py脚本。该脚本负责收集和生成给定arXiv ID的论文评审。

启动命令如下:

python collect.py --arxiv-id <ARXIV_ID> --stop-at-no-html

其中,--arxiv-id <ARXIV_ID>指定了要收集评审的arXiv论文ID,--stop-at-no-html选项表示如果没有找到HTML版本,则停止执行。

3. 项目的配置文件介绍

项目的配置文件位于configs/目录下。以下是主要的配置文件及其作用:

  • config.json:主配置文件,包含项目的全局设置,如API密钥、服务配置等。
  • known_affiliations.json:存储已知机构信息的JSON文件,用于识别论文作者所属机构。
  • known_categories.json:存储已知类别信息的JSON文件,用于分类论文。

这些配置文件可以通过编辑对应的JSON文件来修改配置。例如,如果你需要添加新的已知机构或类别,可以直接在known_affiliations.jsonknown_categories.json中添加相应的条目。

以上是AI论文评审器开源项目的简单教程,希望对你有所帮助。

paper-reviewer Generate a comprehensive review from an arXiv paper, then turn it into a blog post. This project powers the website below for the HuggingFace's Daily Papers (https://huggingface.co/papers). paper-reviewer 项目地址: https://gitcode.com/gh_mirrors/pa/paper-reviewer

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

软件特色   支持批量文件(或目录)同时修改;   时间精度为毫秒级;   可进行固定时间、随机时间、平均时间、递增时间方式修改;   *模式下可使用规则定义灵活地生成随机时间;   可将不同的时间进行绑定,如可让创建时间与访问时间相同,不受设定影响;   可选择性地修改文件时间项,如只修改创建时间;   时间输入框支持键盘方向键调节,可以快速切换数据段并调数值;   可随时为本工具增加、删除系统菜单项,删除后不留垃圾,增加后能在文件/目录上右键快速打开本工具。 功能介绍   时间设定模式分为普通模式和*模式,普通模式又分为:固定时间、随机、平均、递增模式。   固定时间模式:按指定的时间进行修改   随机时间模式:设定时间段(即两个时间点),并在时间段内生成随机的时间   平均时间模式:设定时间段(即两个时间点),并根据文件的总数分摊时间值(需要注意文件的排序)   递增递减模式:设定起点一时间,再设定递增(或递减)的量和单位,按文件列表顺序逐步递增(或递减)时间   *模式:也称为*随机模式,可设定自定义规则,分别对不同数据段设定变动范围,能更加灵活地生成所需要的随机时间。   时间绑定:时间绑定是指将创建时间、 修改时间、 访问时间之间进行同步绑定,使绑定的时间相同,被绑定的时间不再受时间设定影响,直接引用绑定时间。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

吴彬心Quenna

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值