解决WSL环境下DeepSeek-OCR运行时内存不足问题

最新推荐文章于 2025-11-24 20:30:00 发布

原创最新推荐文章于 2025-11-24 20:30:00 发布 · 221 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#ocr #python #deepseek #deepseek-ocr

人工智能同时被 2 个专栏收录

8 篇文章

订阅专栏

deepseek

2 篇文章

订阅专栏

解决WSL环境下DeepSeek-OCR运行时内存不足问题

问题描述

在WSL环境中运行DeepSeek-OCR时出现以下错误：

RuntimeError: unable to mmap 6672547120 bytes from file <./deepseek-ai/DeepSeek-OCR/model-00001-of-000001.safetensors>: Cannot allocate memory (12)

这是由于WSL默认分配的内存不足以加载大型模型导致的。

解决方案

1. 配置WSL内存限制

在Windows中创建或编辑WSL配置文件：

文件位置: C:\Users\<你的用户名>\.wslconfig

添加以下配置内容：

[wsl2]
memory=12GB    # 分配给WSL的内存，建议系统内存的70-80%
swap=4GB       # 交换空间
processors=4   # CPU核心数

2. 重启WSL服务

配置完成后，在Windows PowerShell中执行以下命令重启WSL：

wsl --shutdown

然后重新打开WSL终端即可。

相关配置参数优化

根据config.py中的设置，还可以通过调整以下参数进一步优化内存使用：

MAX_CONCURRENCY: 降低并发数量以减少GPU内存占用
NUM_WORKERS: 减少图像预处理工作线程数
MAX_CROPS: 降低最大裁剪数量以减少内存消耗

这些参数可根据实际硬件配置进行适当调整。

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

明知道的博客

关注关注

8
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

DeepSeek-OCR安装部署文档和避坑指南，包含大多数人遇到的安装报错问题

网易搬砖头

10-22

1634

DeepSeek-OCR安装部署指南摘要：本文详细介绍高性能OCR工具DeepSeek-OCR的安装流程，支持多语言识别和复杂场景文字提取。系统要求包括Linux/Windows/macOS操作系统，推荐NVIDIA显卡(显存≥6GB)和≥16GB内存。安装步骤涵盖：1)创建conda虚拟环境；2)安装PyTorch等核心依赖；3)解决常见问题如CUDA版本冲突、模型下载慢等。提供GPU内存不足等问题的解决方案，帮助开发者快速部署OCR服务。（149字）

DeepSeek-OCR：革命性文档识别模型全面解析及实测

.NET学习

10-27

1456

DeepSeek-OCR是一款革命性文档识别模型，在识别准确率（97%）、多语言支持（100+种）和处理效率（每日3300万页）方面实现重大突破。该模型采用创新的"光学上下文压缩"技术和双核智能架构（DeepEncoder视觉编码器+DeepSeek-3B-MoE解码器），通过将文档视为图像进行视觉压缩，显著提升处理效率。提供5种分辨率模式适应不同场景，支持文档转Markdown、图表解析等多种功能。实测显示对印刷体识别效果优异，但手写体识别仍有提升空间。

参与评论您还未登录，请先登录后发表或查看评论

比较 DeepSeek-R1 模型：32B、70B 和 R1

2401_85343303的博客

03-12

1324

DeepSeek 是一家由梁文锋于 2023 年创立的中国 AI 公司，该公司在发布 DeepSeek-R1 模型后，在人工智能领域取得了重大进展。这种开源语言模型因其在推理任务中的表现而备受关注，可与 OpenAI 的 o1 等模型相媲美。值得注意的是，DeepSeek 仅用通常所需资源的一小部分就实现了这一目标，凸显了中国在 AI 技术领域的快速进步。

deepseek本地部署

Q_Ustinian的博客

08-13

1003

本文介绍了在Windows系统上通过WSL部署DeepSeek语言模型的完整流程。主要内容包括：1）安装WSL并迁移到D盘；2）在Ubuntu中安装Ollama平台；3）下载轻量级DeepSeek-R1-1.5b模型；4）进行网络配置和API测试；5）开发C语言客户端程序，通过JSON格式与模型交互。文章详细说明了每个步骤的操作命令和可能遇到的问题，特别强调了WSL内存管理、多终端操作、IP配置等关键点，最终实现了一个本地运行的AI对话系统解决方案。

用 Docker Compose 部署完整大模型问答系统（DeepSeek-V3 + QLoRA + RAG 实战）

努力分享一些人工智能、计算机视觉、影像等相关的知识干货！

03-26

594

✅ 将 AI 模型从实验走向工程；✅ 解耦训练、推理、检索、前端；✅ 跨平台、跨团队协作复制；✅ 成本可控、更新灵活、安全私有。🧠 不再依赖云服务，你可以拥有自己的私有化 AI 知识中心。

一键瘦身你的文档库：DeepSeek-OCR 把“识字”变成“传意”的上下OCR压缩指南

许泽宇的技术分享

10-21

714

DeepSeek-OCR技术解析：从识别到语义压缩的范式跃迁本文系统介绍了DeepSeek-OCR的核心技术与应用价值。该模型突破传统OCR局限，将"视觉识别"升级为"上下文感知的信息压缩"，支持Markdown、压缩图像等多种高密度输出形式。文章从技术架构、工程实践和场景适配三个维度展开：1)提出"视觉-语言"协同的VLM框架，实现文本、布局、语义的统一建模；2)提供多尺寸推理配置(Tiny到Gundam)和Prompt驱动接口，平衡精度与效率

RAGFlow Windows环境下本地部署全攻略

最新发布

Adrian 博客

11-24

369

中小企业面临招标文件分析效率低、人力成本高的问题。本文分享如何用DeepSeek API+Milvus向量库搭建RAG系统，实现智能文档解析、精准检索与引用，2天开发节省50万外包费，附完整Python代码可直接部署。

以下是针对地质找矿和水工环地质勘查行业的详细部署指南，所有组件均安装在D盘，充分利用GPU资源，实现本地化知识库管理和Word报告自动化生成： --- ### **一、系统准备与目录创建** #### **1. 创建主目录结构** ```powershell # 打开PowerShell（管理员权限） # 创建主目录 mkdir D:\personal ai # 创建子目录 mkdir D:\personal ai\docker-data mkdir D:\personal ai\ollama mkdir D:\personal ai\ragflow mkdir D:\personal ai\dify mkdir D:\personal ai\models mkdir D:\personal ai\templates mkdir D:\personal ai\output ``` #### **2. 更新显卡驱动** 1. 访问[NVIDIA驱动下载页](https://www.nvidia.cn/Download/index.aspx) 2. 选择匹配显卡的驱动程序 3. 安装时选择： - **自定义安装** - 勾选**清洁安装** - 安装位置选择：`D:\personal ai\NVIDIA` --- ### **二、Docker Desktop安装与汉化** #### **1. 安装Docker Desktop** 1. 下载安装程序：[Docker Desktop for Windows](https://desktop.docker.com/win/main/amd64/Docker%20Desktop%20Installer.exe) 2. 运行安装程序： - 取消勾选"Use WSL 2 instead of Hyper-V" - 点击"Advanced"： - 安装路径：`D:\personal ai\Docker` - 数据存储路径：`D:\personal ai\docker-data` - 勾选： - ☑ Add shortcut to desktop - ☑ Enable WSL 2 Features - ☑ Add Docker binaries to PATH #### **2. Docker汉化** ```powershell # 下载汉化包 Invoke-WebRequest -Uri "https://ghproxy.com/https://github.com/Docker-Hub-frproxy/docker-desktop-zh/releases/download/v4.30.0/zh-CN.zip" -OutFile "D:\personal ai\docker-zh.zip" # 解压并替换文件 Expand-Archive -Path "D:\personal ai\docker-zh.zip" -DestinationPath "D:\personal ai\Docker\resources" -Force # 重启Docker Restart-Service -Name "Docker Desktop Service" ``` #### **3. 配置GPU支持** 1. 创建配置文件： ```powershell notepad $env:USERPROFILE\.wslconfig ``` 2. 输入以下内容： ```ini [wsl2] memory=16GB # 根据实际内存调整，建议≥16GB processors=8 # 根据CPU核心数调整 swap=0 localhostForwarding=true [nvidia] enabled=true cudaVersion=12.2 # 与安装的CUDA版本一致 ``` --- ### **三、Ollama + DeepSeek部署** #### **1. 安装Ollama** ```powershell # 下载安装程序 Invoke-WebRequest -Uri "https://ollama.com/download/OllamaSetup.exe" -OutFile "D:\personal ai\OllamaSetup.exe" # 静默安装到指定目录 Start-Process "D:\personal ai\OllamaSetup.exe" -ArgumentList "/S /D=D:\personal ai\ollama" -Wait ``` #### **2. 配置模型存储路径** ```powershell # 设置环境变量 [Environment]::SetEnvironmentVariable("OLLAMA_MODELS", "D:\personal ai\models", "Machine") # 重启Ollama服务 Restart-Service -Name "Ollama" ``` #### **3. 下载DeepSeek模型** ```powershell # 拉取7B参数模型（适合44GB显存） ollama pull deepseek-llm:7b # 验证安装 ollama run deepseek-llm:7b "地质找矿的基本流程是什么？" ``` --- ### **四、RAGFlow本地部署** #### **1. 创建docker-compose.yml** ```powershell # 创建配置文件 @" version: '3.8' services: ragflow: image: infiniflow/ragflow:latest container_name: ragflow ports: - "9380:9380" volumes: - "D:/personal ai/ragflow/data:/opt/ragflow/data" - "D:/personal ai/models:/opt/ragflow/models" environment: - NVIDIA_VISIBLE_DEVICES=all - NVIDIA_DRIVER_CAPABILITIES=compute,utility deploy: resources: reservations: devices: - driver: nvidia count: 2 capabilities: [gpu] "@ | Out-File -FilePath "D:\personal ai\ragflow\docker-compose.yml" -Encoding utf8 ``` #### **2. 启动RAGFlow** ```powershell # 进入目录 cd D:\personal ai\ragflow # 启动容器 docker compose up -d # 查看日志（确保正常运行） docker logs ragflow ``` --- ### **五、Dify工作流部署** #### **1. 创建docker-compose.yml** ```powershell @" version: '3' services: dify: image: langgenius/dify:latest container_name: dify ports: - "80:3000" volumes: - "D:/personal ai/dify/data:/data" environment: - DB_ENGINE=sqlite - GPU_ENABLED=true depends_on: - ragflow "@ | Out-File -FilePath "D:\personal ai\dify\docker-compose.yml" -Encoding utf8 ``` #### **2. 启动Dify** ```powershell cd D:\personal ai\dify docker compose up -d ``` --- ### **六、地质行业知识库配置** #### **1. 上传地质资料** 1. 访问 `http://localhost:9380` 2. 创建知识库 → 命名"地质矿产知识库" 3. 上传文件类型： - 地质调查报告（PDF/DOCX） - 矿产储量估算表（XLSX） - 水文地质图件（JPG/PNG） - 工程地质剖面图（DWG） #### **2. 配置检索策略** ```yaml # 在RAGFlow高级设置中 chunk_size: 1024 # 适合技术文档 chunk_overlap: 200 metadata_fields: # 地质专用元数据 - project_name - geological_period - mineral_type - gis_coordinates ``` --- ### **七、报告生成工作流配置** #### **1. 在Dify中创建工作流** 1. 访问 `http://localhost` 2. 创建应用 → 选择"工作流" 3. 节点配置： ``` [输入] → [RAGFlow检索] → [Ollama处理] → [Word生成] ``` #### **2. 配置Ollama节点** ```json { "model": "deepseek-llm:7b", "parameters": { "temperature": 0.3, "max_tokens": 4096, "system_prompt": "你是一位资深地质工程师，负责编写专业地质报告。使用规范的地质术语，遵循GB/T 9649地质矿产术语标准。" } } ``` #### **3. 创建Word模板** 1. 在 `D:\personal ai\templates` 创建 `地质报告模板.docx` 2. 包含字段： ```markdown ## {{project_name}}地质调查报告 ### 一、区域地质背景 {{regional_geology}} ### 二、矿产特征 {{mineral_characteristics}} ### 三、水文地质条件 {{hydrogeological_conditions}} [附图:{{figure_number}}] ### 四、资源量估算（单位：万吨） | 矿种 | 332 | 333 | 334 | |---|---|---|---| {{resource_table}} ``` #### **4. Python报告生成脚本** 在Dify中创建 `report_generator.py`： ```python from docx import Document from docx.shared import Pt import pandas as pd import json def generate_geological_report(data): # 加载模板 doc = Document(r'D:\personal ai\templates\地质报告模板.docx') # 填充文本内容 for p in doc.paragraphs: p.text = p.text.replace('{{project_name}}', data['project_name']) p.text = p.text.replace('{{regional_geology}}', data['regional_geology']) p.text = p.text.replace('{{hydrogeological_conditions}}', data['hydro_conditions']) # 填充资源表格 table = doc.tables[0] resources = json.loads(data['resource_table']) for i, mineral in enumerate(resources): row = table.add_row() row.cells[0].text = mineral['type'] row.cells[1].text = str(mineral['332']) row.cells[2].text = str(mineral['333']) row.cells[3].text = str(mineral['334']) # 保存报告 output_path = fr"D:\personal ai\output\{data['project_name']}_地质调查报告.docx" doc.save(output_path) return {"status": "success", "path": output_path} ``` --- ### **八、工作流测试与使用** #### **1. 触发报告生成** ```powershell curl -X POST http://localhost/v1/workflows/run \ -H "Content-Type: application/json" \ -d '{ "inputs": { "project_name": "云南某铜矿勘探", "requirements": "需要包含：\n1. 矿区水文地质分析\n2. 铜矿体三维模型描述\n3. JORC标准资源量估算" } }' ``` #### **2. 输出结果** - 生成文件：`D:\personal ai\output\云南某铜矿勘探_地质调查报告.docx` - 日志位置：`D:\personal ai\dify\data\logs\workflow.log` #### **3. 典型报告结构** ```markdown ## 云南某铜矿勘探地质调查报告 ### 一、区域地质背景位于扬子地块西缘，出露地层主要为二叠系阳新组灰岩... ### 二、矿产特征发现3条铜矿体，呈层状产出，平均品位Cu 1.2%... ### 三、水文地质条件矿区内发育两条季节性河流，地下水类型主要为基岩裂隙水...[附图:图3] ### 四、资源量估算（单位：万吨） | 矿种 | 332 | 333 | 334 | |------|-----|-----|-----| | 铜矿 | 120 | 280 | 150 | ``` --- ### **九、维护与优化** #### **1. GPU监控** ```powershell # 查看GPU利用率 nvidia-smi --query-gpu=utilization.gpu --format=csv -l 5 # Ollama GPU加速验证 ollama run deepseek-llm:7b --verbose ``` #### **2. 地质专业词库增强** 1. 在 `D:\personal ai\models` 创建 `geology_terms.txt` 2. 添加专业术语： ```text 水工环地质矿产普查资源量估算地层划分构造解析 ``` 3. 在RAGFlow配置中加载术语库 #### **3. 常见问题解决** **问题1：Docker容器无法访问GPU** ```powershell # 验证NVIDIA容器工具包 docker run --rm --gpus all nvidia/cuda:12.2.0-base nvidia-smi # 解决方案 nvidia-smi --gpu-reset ``` **问题2：中文PDF解析乱码** ```yaml # 在RAGFlow配置中添加 parser_config: pdf: text_extraction: lang: chi_sim # 使用中文OCR ``` **问题3：报告生成格式错误** ```python # 在Python脚本中添加格式修复 def fix_table_format(table): for row in table.rows: for cell in row.cells: for paragraph in cell.paragraphs: paragraph.paragraph_format.space_before = Pt(0) paragraph.paragraph_format.space_after = Pt(0) ``` --- ### **十、地质行业应用场景** #### **1. 自动化报告类型** 1. 矿产勘探阶段性报告 2. 水文地质调查评价 3. 矿山环境影响评估 4. 地质灾害风险分析 5. 资源储量动态报表 #### **2. 效率提升对比** | 任务类型 | 传统耗时 | 系统耗时 | |---------|---------|---------| | 矿产调查报告 | 40小时 | 2小时 | | 水文地质图件说明 | 16小时 | 45分钟 | | 资源量估算表 | 8小时 | 实时生成 | 分析优化以上部署方案

06-25

-**系统稳定性**：长时间运行可能出现内存泄漏、服务中断等问题。###3.**优化策略**####3.1**GPU资源利用率提升**-**模型量化**：将Ollama中的LLM转换为低精度（如FP16或INT8）以减少显存占用和加速推理[^1]。-**...

本地deepseek配置要求

02-09

为了在本地环境中成功设置并运行 DeepSeek R1 Dynamic 1.58-bit 版本，需满足一系列硬件和软件条件[^1]。 #### 硬件要求 - **处理器**: 推荐使用多核 CPU 或者 GPU 加速器来提升处理速度。 - **内存**: 至少 16GB ...

windows7实现deepseek本地数据库投喂功能

03-11

- 使用虚拟机安装 Linux 子系统（如 WSL）运行 Ollama[^1] - 通过 Docker 容器部署 Ollama（需提前安装 Docker 环境） - **拉取嵌入模型** 在命令行执行以下命令，下载文本向量化模型 `bge-m3`： ```bash ...

请深入说下操作和搭建的步骤，目前已经有DEEPSEEK大模型和接入的APIKEY 利用DeepSeek + RAGFlow搭建利用Ollama、DeepSeek、Docker和RAGFlow在本地搭建一个私有知识问答库，结合强大的语言模型、高效的语义理解和灵活的检索增强生成技术，实现安全、可靠的企业级私有知识库系统2

10-29

我们已有DeepSeek大模型和API KEY，现在要利用DeepSeek、RAGFlow、Ollama和Docker在本地搭建企业级私有知识库系统。根据引用[1][2][3][4]，搭建步骤可以分为环境准备、安装Docker、安装Ollama（以GPU模式启动）、...

纸质手写表格二次录入效率低？旗讯 OCR 技术方案与行业落地实践

qxsz_yyh的博客

11-20

776

摘要：本文针对制造业、金融、政务等领域手写登记表数字化面临的图像质量差、字符识别难、系统对接复杂等痛点，提出旗讯OCR四层技术架构解决方案。通过改进预处理算法、行业专属字符库、双重校验机制和标准化接口，实现99.2%的识别准确率，误差率≤0.5%。结合苏州新材料厂、银行报销系统等案例，验证方案可使效率提升7-12倍，成本降低80%以上。建议企业选型时重点关注场景适配性、集成便捷性和系统稳定性，推动纸质数据向数字资产的高效转化。

旗讯 OCR 技术解析：金融行业手写表格识别方案与系统集成实践

qxsz_yyh的博客

11-19

714

金融OCR技术助力行业数字化转型：旗讯手写表格识别方案解析摘要：本文聚焦金融行业手写表格处理痛点，解析旗讯OCR的创新解决方案。针对金融场景中存在的字迹复杂、格式多样、合规要求高等挑战，该系统采用三层技术架构实现高精度识别：基于千万级金融样本训练的专属模型（准确率≥98%）、无边界表格解析算法（还原准确率≥99%）、以及内置敏感数据脱敏功能。通过银行报销单、基金投入表、保险回访记录三个典型场景验证，处理效率提升90%以上，误差率降低96%。系统支持本地/云端部署，已完成20+主流金融系统预适配，为行业数字

DeepSeek OCR vs Qwen-3 VL vs Mistral OCR：谁更胜一筹？

2501_94005722的博客

11-21

940

DeepSeek OCR采用了一套大型且专用的模型架构，以“推理速度与运行效率”为核心优化方向。其创新研发的“上下文光栅化”技术，实现了视觉信息的高效处理与精准转换，能够在保证识别精度的同时，满足大规模数据处理的效率需求。该模型的整体设计聚焦企业级应用场景，具备良好的可扩展性，能够适配从中小规模业务到大规模部署的全场景需求。当前OCR技术的发展趋势已从“单纯追求高精度”转向“快速、准确、上下文感知的一体化提取”，企业选型应聚焦“实际应用可靠性”而非单纯的理论指标。

大模型 + 字形理解：Glyph-OCR 带来的 OCR 新范式

清风徐来

11-19

711

摘要：GlyPh-OCR提出了一种创新的字形识别方法，通过将字符视觉信息离散化为glyph tokens，使模型能真正"看懂"字形结构。其核心流程包括字符检测、切割、字形编码和语言模型推理三大模块，形成模块化OCR pipeline。相比传统OCR，GlyPh-OCR在模糊文字、异体字识别方面表现优异，特别适合古籍、低清图像等场景。虽然不具备文档级理解能力，但解决了字形识别的本源问题，与DeepSeek-OCR等端到端模型形成互补。该技术强调字形理解而非单纯文本推断，为OCR领域提供了新

我的AI大模型OCR票据识别最佳实践

刘欣的优快云博客

11-19

611

本文介绍了RPA流程机器人结合Qwen2.5-VL大模型自动处理银行票据的创新实践。项目组通过测试发现，相比传统OCR设备，LLM模型对非固定格式票据的识别率更高。在提示词优化过程中，团队开发了批量测试工具，通过调整参数和细化指令，最终使AI的票据识别准确率达到人工水平。文中分享了提示词优化经验，包括固定字段输出、调整温度参数等技巧，特别提到针对"收款人户名"字段的特定提示词使识别率提升显著。

deepseek-ocr部署

10-27

<think>嗯，用户需要了解DeepSeek-OCR的部署步骤和方法。根据系统级指令的要求，需要严格遵循格式规范，同时提供清晰的结构化回答。用户明确提到了引用内容[^1]，这份DeepSeek-OCR安装部署文档确实提供了关键信息。但要注意用户提示"上述引用仅供参考"，说明实际需求比引用描述更具体——用户需要的是实操性强的部署指南。从技术角度看，OCR部署通常包含几个核心环节：环境准备（特别是CUDA等深度学习依赖）、模型获取（官网提供的预训练模型）、服务配置（端口和API设置）、启动验证（测试图片识别）。需要突出强调显卡驱动和CUDA版本兼容性，这是深度学习部署最常见的坑。准备在回答中分四个步骤展开：首先是环境检测环节（重点说明nvidia-smi和CUDA版本检查），然后是依赖安装的两种方式（pip和源码编译的区别要考虑说明），接着配置模型路径这个关键参数，最后用命令行示例展示启动方式。每个步骤都要包含避坑提示，比如虚拟环境的使用、端口冲突处理等。考虑到用户可能是开发者，要补充性能调优参数（如batch_size）和日志查看方法。验证环节准备提供curl测试命令和预期输出示例，这样用户能快速确认部署成功。相关问题设计要覆盖延伸需求：离线部署考虑私有化场景，GPU替代方案针对资源受限用户，多语言支持则是实际应用的常见需求。还应该包含故障排查这个刚需方向。 </think>以下是DeepSeek-OCR的详细部署步骤和方法，结合官方文档和常见避坑指南整理[^1]： ### 部署步骤 1. **环境准备** - 系统要求：Linux (Ubuntu 20.04+ 推荐) / Windows WSL2 - 硬件要求： - NVIDIA GPU (显存 ≥ 8GB) - CUDA 11.8+ / cuDNN 8.6+ - 安装依赖： ```bash sudo apt update && sudo apt install -y python3.10 python3-pip build-essential libgl1 python3 -m pip install virtualenv ``` 2. **安装DeepSeek-OCR** ```bash # 创建虚拟环境 python3 -m virtualenv ocr_env source ocr_env/bin/activate # 安装核心包 (选择以下任一方式) ## 方式1：PyPI安装 pip install deepseek-ocr ## 方式2：源码安装（推荐） git clone https://github.com/deepseek-ai/DeepSeek-OCR cd DeepSeek-OCR pip install -r requirements.txt ``` 3. **模型配置** - 下载预训练模型（官网或HuggingFace Hub）： ```bash wget https://models.deepseek.com/ocr/v1.0/general_ocr.pt ``` - 配置模型路径： ```yaml # config.yaml model_path: "./general_ocr.pt" device: "cuda:0" # 使用GPU加速 ``` 4. **启动服务** ```bash # 启动HTTP服务 (默认端口5000) deepseek-ocr serve --config config.yaml # 测试调用 curl -X POST -F "image=@test.jpg" http://localhost:5000/ocr ``` ### 常见问题解决（避坑指南） | 问题现象 | 解决方案 | |---------------------------|-----------------------------------| | `CUDA out of memory` | 减小`batch_size`参数 / 升级显存 | | `libcudart not found` | 验证CUDA路径：`export LD_LIBRARY_PATH=/usr/local/cuda/lib64` | | 中文识别乱码 | 安装中文字体：`sudo apt install fonts-wqy-microhei` | | Windows端口占用 | 修改端口：`deepseek-ocr serve --port 6000` | > **关键提示**：首次运行会自动下载模型（约1.5GB），建议通过官网提前下载[^1]。 --- ### 验证部署成功 1. 准备测试图片 `test.jpg` ```bash echo "Hello DeepSeek-OCR" > test.txt convert -size 800x200 xc:white -pointsize 36 -fill black -draw "text 20,100 'Hello DeepSeek-OCR'" test.jpg ``` 2. 执行OCR识别： ```bash deepseek-ocr predict --image test.jpg ``` 3. 预期输出： ``` { "text": "Hello DeepSeek-OCR", "confidence": 0.98 } ``` ---