PolyglotPDF 项目使用教程

PolyglotPDF 项目使用教程

PolyglotPDF (PDF translation)Multilingual PDF processing tool, supports online and offline translation while maintaining original layout; performs OCR on scanned PDFs, faster than ocrmypdf. Provides a Web UI for comparing original PDFs, includes chat with PDF functionality, and academic PDF search based on the Semantic Scholar API. PolyglotPDF 项目地址: https://gitcode.com/gh_mirrors/po/PolyglotPDF

1. 项目目录结构及介绍

PolyglotPDF 是一个多语言电子书处理工具,支持所有电子书格式。以下是其主要目录结构及文件介绍:

PolyglotPDF/
├── EbookTranslator/            # EbookTranslator 库文件
├── static/                    # 静态文件,如样式表和脚本
├── .dockerignore              # Docker构建时需要忽略的文件
├── All_Translation.py         # 所有翻译功能的实现文件
├── Deepl_Translation.py       # Deepl 翻译 API 的实现文件
├── Dockerfile                 # Docker构建文件
├── LICENSE                    # 项目许可证文件
├── LLMS_translation.py        # LLMS 翻译 API 的实现文件
├── OldMain.py                 # 旧版本的主程序文件
├── README.md                  # 项目说明文件
├── README_CN.md               # 项目说明文件(简体中文)
├── README_JA.md               # 项目说明文件(日语)
├── README_KO.md               # 项目说明文件(韩语)
├── README_TW.md               # 项目说明文件(繁体中文)
├── YouDao_translation.py      # 有道翻译 API 的实现文件
├── app.py                     # Flask 应用启动文件
├── build.py                   # 构建脚本
├── config.json                # 配置文件
├── convert2pdf.py             # 转换为 PDF 的脚本
├── demo.mp4                   # 示例视频文件
├── demo.pdf                   # 示例 PDF 文件
├── demo_zh.pdf                # 示例翻译后的 PDF 文件
├── docker-compose.yml         # Docker 编排文件
├── download_model.py          # 下载模型文件
├── icon.ico                   # 项目图标
├── index.html                 # 项目主页面 HTML 文件
├── languagedetect.py          # 语言检测脚本
├── load_config.py             # 加载配置文件脚本
├── main.py                    # 主程序文件
├── pdf_thumbnail.py           # PDF 缩略图生成脚本
├── pdfviewer.html             # PDF 阅读器 HTML 文件
├── recent.json                # 最近文件记录文件
├── requirements.txt           # 项目依赖文件

2. 项目的启动文件介绍

项目的启动文件是 app.py,它使用了 Flask 框架来创建一个 web 服务。以下是启动文件的主要功能:

  • 初始化 Flask 应用
  • 设置应用配置
  • 定义路由和视图函数
  • 运行 Flask 应用

启动项目的命令是:

python app.py

执行后,应用将在本地开发服务器上运行,默认端口为 8000。

3. 项目的配置文件介绍

项目的配置文件是 config.json,它包含项目中使用的各种配置信息。以下是配置文件的一些主要配置项:

{
  "count": 4,
  "PPC": 20,
  "translation_services": {
    "Doubao": {
      "auth_key": "",
      "model_name": ""
    },
    "Qwen": {
      "auth_key": "",
      "model_name": "qwen-plus"
    },
    "deepl": {
      "auth_key": ""
    },
    "deepseek": {
      "auth_key": "",
      "model_name": "ep-20250218224909-gps4n"
    },
    "openai": {
      "auth_key": "",
      "model_name": "gpt-4o-mini"
    },
    "youdao": {
      "app_key": "",
      "app_secret": ""
    }
  },
  "ocr_services": {
    "tesseract": {
      "path": "C:\\Program Files\\Tesseract-OCR\\tesseract.exe"
    }
  },
  "default_services": {
    "ocr_model": false,
    "line_model": false,
    "Enable_translation": true,
    "Translation_api": "openai"
  }
}

在这个文件中,可以配置翻译服务的 API 密钥、模型名称以及其他服务相关的设置。确保在运行项目前正确填写所需的配置信息。

PolyglotPDF (PDF translation)Multilingual PDF processing tool, supports online and offline translation while maintaining original layout; performs OCR on scanned PDFs, faster than ocrmypdf. Provides a Web UI for comparing original PDFs, includes chat with PDF functionality, and academic PDF search based on the Semantic Scholar API. PolyglotPDF 项目地址: https://gitcode.com/gh_mirrors/po/PolyglotPDF

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

柳霆烁Orlantha

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值