如何使用 Papermerge:开源文档管理系统的完整安装与配置指南 📄
Papermerge 是一款专为数字档案(扫描文档)设计的开源文档管理系统,支持 OCR 文本提取、全文搜索和文件夹式管理,帮助用户高效存储和检索各类文档。通过直观的网页界面,你可以轻松上传、分类和搜索扫描文件,让纸质文档数字化管理变得简单高效。
🚀 为什么选择 Papermerge?核心功能亮点
Papermerge 提供了一系列强大功能,满足个人和小型团队的文档管理需求:
- 📄 多格式支持:兼容 PDF、TIFF、JPEG 和 PNG 等主流文档格式
- 🔍 OCR 与全文搜索:自动提取扫描文档中的文字,支持精准内容检索
- 🗂️ 分层文件夹结构:像桌面文件管理器一样组织文档,支持拖拽操作
- 🏷️ 标签与版本控制:用彩色标签分类文档,追踪修改历史
- ✂️ 页面管理:轻松删除、重排或提取文档页面,灵活编辑PDF内容

图:Papermerge 直观的双栏式文档管理界面,支持拖拽操作和标签分类
🔧 快速安装指南:3种简单方法
1️⃣ Docker 一键部署(推荐新手)
Docker 方式最快捷,无需复杂配置即可启动完整系统:
# 克隆仓库
git clone https://gitcode.com/gh_mirrors/pa/papermerge
cd papermerge
# 启动容器
docker-compose up -d
系统会自动创建包含 Web 应用、数据库和后台任务的完整环境,访问 http://localhost:8000 即可使用。初始账号需通过以下命令创建:
docker exec -it papermerge_app python manage.py createsuperuser
2️⃣ 本地开发环境搭建
适合开发者或需要自定义配置的用户:
# 克隆代码库
git clone https://gitcode.com/gh_mirrors/pa/papermerge
cd papermerge
# 创建虚拟环境
python -m venv venv
source venv/bin/activate # Linux/Mac
venv\Scripts\activate # Windows
# 安装依赖
pip install -r requirements/production.txt
# 初始化数据库
python manage.py migrate
# 创建管理员账号
python manage.py createsuperuser
# 启动开发服务器
python manage.py runserver
3️⃣ 生产环境配置
生产环境需修改配置文件 config/settings/production.py,设置数据库连接和静态文件路径,推荐配合 Nginx 和 Gunicorn 使用以获得更好性能。
⚙️ 关键配置文件解析
核心设置:config/settings/base.py
此文件包含系统基础配置,关键参数如下:
INSTALLED_APPS:已安装的功能模块,包括文档管理核心papermerge.coreDATABASES:数据库连接配置,默认使用 PostgreSQLMEDIA_ROOT:上传文档的存储路径,建议设置为独立目录PAPERMERGE_OCR_AUTO:是否自动对上传文档执行 OCR,默认开启LANGUAGES:支持的 OCR 识别语言,可添加中文、日文等
自定义配置:papermerge.conf.py
复制示例配置创建个性化设置:
cp papermerge.conf.py.example papermerge.conf.py
在此文件中可覆盖默认参数,如调整 OCR 引擎路径或设置邮件通知。
📚 基础使用教程:3分钟上手
1. 上传与分类文档
- 点击左侧「上传」按钮选择本地文件,支持批量上传
- 创建文件夹整理文档,支持拖拽移动和多级嵌套
- 为重要文档添加彩色标签(如「发票」「合同」)以便快速筛选
2. 搜索与检索
在顶部搜索框输入关键词,系统会自动匹配文档内容和文件名。支持高级筛选:
- 按文件类型(PDF/图片)
- 按修改日期
- 按标签或所属文件夹
3. 高级功能:页面管理
选中文档后点击「页面」选项卡,可执行以下操作:
- 删除冗余页面
- 调整页面顺序
- 提取特定页面另存为新文档

图:Papermerge 页面管理功能,支持直观的拖放排序和批量操作
🛠️ 常见问题解决
❓ OCR 识别中文乱码怎么办?
- 安装中文语言包:
sudo apt install tesseract-ocr-chi-sim - 修改配置文件
config/settings/base.py,添加:LANGUAGES = [ ('en', 'English'), ('zh-cn', 'Chinese (Simplified)'), ]
❓ 如何迁移已有文档到新服务器?
只需复制 media_root 目录(Docker 部署路径在 docker-compose.yml 中定义),并在新环境中恢复数据库即可。
📝 总结与资源
Papermerge 凭借强大的 OCR 功能和直观的界面,成为扫描文档管理的理想选择。无论是个人用户整理收据发票,还是小型团队管理业务文档,都能显著提升工作效率。
- 官方文档:项目根目录下的 README.md 提供详细开发指南
- 示例数据:example_data/ 目录包含测试用文档,可用于功能验证
- Docker 配置:docker/ 文件夹提供完整的容器化部署方案
立即尝试 Papermerge,让你的文档管理工作变得简单而高效!✨
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



