DeepSeek-OCR 本地部署使用教程(附完整环境配置与推理示例)

作者:[夔嶷]
平台:优快云
项目地址https://github.com/deepseek-ai/DeepSeek-OCR
参考教程Apifox 技术指南


在这里插入图片描述

一、前言

DeepSeek-OCR 是由 DeepSeek AI 推出的开源 OCR 模型,专为高精度文档识别与结构化输出而设计。它不仅能识别图像中的文字,还能将其转换为 Markdown、保留布局结构,甚至解析图表内容。本文将手把手教你如何在本地部署 DeepSeek-OCR,并使用 vLLMTransformers 两种方式进行推理。


二、系统与硬件要求

系统环境

  • 操作系统:Linux / Windows / macOS(推荐 Linux)
  • Python 版本:3.12.9
  • CUDA 版本:11.8+
  • PyTorch 版本:2.6.0

硬件建议

  • GPU:A100-40G 或同等性能(如 RTX 4090、3090)
  • 显存:≥24GB(处理 PDF 或大图时建议 ≥40GB)
  • 内存:≥16GB
  • 存储:≥10GB(模型约 5–8GB)

三、项目克隆与环境搭建

1. 克隆项目

git clone https://github.com/deepseek-ai/DeepSeek-OCR.git
cd DeepSeek-OCR

2. 创建 Conda 环境(推荐)

conda create -n deepseek-ocr python=3.12.9 -y
conda activate deepseek-ocr

3. 安装 PyTorch(CUDA 11.8)

pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://download.pytorch.org/whl/cu118

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值