- 博客(173)
- 资源 (27)
- 收藏
- 关注
原创 DeepSeek-OCR 部署、配置解析与测试完整指南
DeepSeek-OCR 是 DeepSeek-AI 提出的用于探索视觉 2D 映射压缩长上下文可行性的视觉语言模型(VLM),由DeepEncoder(核心编码器,~380M 参数)和DeepSeek3B-MoE-A570M 解码器(激活 570M 参数)构成;其核心优势在于 DeepEncoder 通过串联窗口注意力(SAM-base)、16× 卷积压缩器与全局注意力(CLIP-large),实现高分辨率输入下的低激活内存与高压缩比,实验显示在 Fox 基准上。
2025-11-10 19:00:40
1822
2
原创 深度解读 DeepSeek-OCR 论文:通过视觉模态实现高效文本压缩
DeepSeek-OCR 是 DeepSeek-AI 提出的用于探索视觉 2D 映射压缩长上下文可行性的视觉语言模型(VLM),由DeepEncoder(核心编码器,~380M 参数)和DeepSeek3B-MoE-A570M 解码器(激活 570M 参数)构成;其核心优势在于 DeepEncoder 通过串联窗口注意力(SAM-base)、16× 卷积压缩器与全局注意力(CLIP-large),实现高分辨率输入下的低激活内存与高压缩比,实验显示在 Fox 基准上。
2025-11-10 18:50:33
1064
原创 PP-OCRv5文本识别流程及原理解析
总的来说,PP-OCRv5通过其图像预处理→文本检测→文本方向分类→文本识别的四步流水线,构建了一个高效、精准且轻量的文字识别解决方案。其在手写体、多语言场景下的强劲表现,以及适合边缘部署的特性,使其成为文档数字化、教育、金融、智能交通等多个领域的理想选择。模块核心算法输入输出关键创新文本检测DBNet完整图像所有文本行的包围框可微分二值化(高效特征融合)、针对任意形状文本的优化方向分类轻量级CNN单个文本行图像文本方向类别极致的轻量化、将方向问题转化为多分类问题、依赖高质量合成数据。
2025-11-03 19:31:41
1372
原创 ReAct 与 Function Call:两种主流 Agent 技术解析与实践
在人工智能领域,Agent 技术正成为推动 AI 系统向主动推理、复杂任务处理演进的核心方向。本文将深入解析当前主流的两种 Agent 技术 ——ReAct(推理与行动协同框架)和Function Call(结构化功能调用),探讨其技术原理、应用场景及开发实践要点。
2025-11-03 19:23:11
855
原创 详解混合检索中 RPF 排序算法(Reciprocal Rank Fusion)
RPF(Reciprocal Rank Fusion)排序算法作为一种高效的结果融合方法,能够有效整合多个检索系统的输出,生成更优的排序结果
2025-10-15 18:08:31
694
原创 从大模型到轻量级部署:知识蒸馏优化技术
知识蒸馏(Knowledge Distillation, KD)是一种模型压缩与优化技术,旨在将复杂高性能模型(教师模型,Teacher Model)的 “知识” 迁移到轻量模型(学生模型,Student Model)中,使学生模型在参数量和计算成本大幅降低的同时,尽可能保留教师模型的性能。
2025-10-10 18:31:02
390
原创 HTTP 请求体格式全解:none/form-data/urlencoded/raw/binary/msgpack 原理与 Python 实现
在 HTTP 请求中,请求体(Request Body)的格式决定了数据的组织方式,不同格式适用于不同的场景。HTTP请求体(Body)的格式根据数据类型和编码方式不同,主要分为:none、form-data、raw、urlencoded、binary和msgpack。
2025-09-24 19:11:48
754
1
原创 15 种 HTTP 请求方法详解:从 GET/POST 核心方法到 WebDAV 扩展及Python实现示例
HTTP(Hypertext Transfer Protocol)是一种在计算机网络中用于传输超媒体文档的应用层协议。HTTP 协议定义了客户端和服务器之间的通信规则,并规定了客户端向服务器发送请求时需要采用的请求方法(请求方式)。
2025-09-08 19:13:59
1247
原创 接口设计标准化流程,结合RESTful最佳实践和实际开发经验,涵盖从需求分析到部署的全过程
接口设计标准化流程,结合RESTful最佳实践和实际开发经验,涵盖从需求分析到部署的全过程
2025-09-03 19:32:30
748
原创 深入理解CI/CD:构建、测试和部署的完整流程
CI/CD 旨在通过自动化流程和工具简化并加快软件开发生命周期,它是现代软件开发中的核心实践,通过自动化流程将代码变更快速、可靠地交付到生产环境。
2025-09-02 21:16:01
1616
原创 DevOps 详解:文化、实践与工具链
DevOps是 Development(开发)和 Operations(运维) 的融合,通过打破部门壁垒、自动化流程和工具链集成,实现软件交付效率最大化和系统稳定性最优化。
2025-09-01 19:01:36
765
原创 利用 Windows GPU 在 WSL2 中安装并配置 CUDA Toolkit
要在 WSL2(Ubuntu 22.04)中使用 GPU,需依赖 Windows 的 NVIDIA 驱动提供硬件支持,并在 WSL 内安装 CUDA Toolkit 及配置环境。
2025-08-20 19:07:29
1933
1
原创 Elasticsearch全文检索中文分词:IK分词器详解与Docker环境集成
IK分词器(IK Analyzer)是Elasticsearch中广泛使用的中文分词插件,专门针对中文文本进行高效的分词处理。
2025-08-18 19:40:01
2060
3
原创 详解 doclayout_yolo:Python 文档布局检测
doclayout_yolo 是一个基于 YOLOv10 架构的文档布局检测工具包,旨在快速、高效地识别文档中的不同元素(如文本、图像、表格、标题等)。它结合了 DocSynth-300K 数据集的预训练模型和全局到局部的感知机制,适用于论文、教科书、试卷、幻灯片等多种文档类型的布局分析。
2025-08-18 19:31:50
1044
原创 PyMuPDF 详解:Python 高效处理 PDF 文档
PyMuPDF(又称 `fitz`)是一个功能强大的 Python 库,用于处理 PDF、XPS、EPUB、MOBI 等文档格式。它基于 MuPDF(轻量级 PDF 渲染引擎),提供高效的文本提取、渲染、编辑和文档分析功能。
2025-08-14 17:55:59
950
原创 一文吃透 pdf2image:Python 处理 PDF 转图片的完整指南
pdf2image 是一个用于将 PDF 文件转换为图像的 Python 库,它基于强大的 poppler-utils 工具集,提供简单高效的 PDF 到图像的转换功能。
2025-08-12 17:55:02
1822
原创 Docker 加载镜像时出现 “no space left on device” 错误的解决方法
在 Docker 使用过程中,"no space left on device" 错误是常见的磁盘空间不足问题。本文将结合实战操作,详细介绍该问题的排查与解决步骤,帮助开发者快速定位并修复问题。
2025-08-07 17:49:18
954
原创 知识库搜索新范式:FastGPT知识库搜索方案全解析
FastGPT 知识库结构设计,理解其 QA 的存储格式和多向量映射,以便更好的构建知识库
2025-06-23 19:56:54
1456
原创 RAG检索增强生成技术:原理剖析、应用场景与优劣对比
RAG检索增强生成:从理论到实践的应用与挑战检索增强生成(RAG)全面解析:原理、场景与优化方向
2025-06-18 20:59:50
849
原创 基于vLLM高效部署多模态大模型Qwen2.5-VL实战指南及优化策略
基于vLLM高效部署多模态大模型Qwen2.5-VL实战指南及优化策略
2025-06-18 20:12:09
5368
2
原创 Python包管理工具之uv使用指南
uv 是一个新兴的 Python 包管理工具,它旨在提供比 pip 和 poetry更快、更现代的依赖管理体验。
2025-06-16 20:50:09
2080
原创 高效管理Python环境:Miniforge、pyenv和Poetry深度对比与应用
在 Python 开发中,构建和管理环境是至关重要的。为了更好地隔离项目依赖、管理不同版本的 Python 解释器以及简化包管理,开发者常使用工具来辅助开发环境的搭建。以下是三种常见的 Python 环境管理工具Miniforge、pyenv和Poetry,它们各有特点,适用于不同的场景。
2025-06-12 19:40:07
1453
原创 基于vLLM高效部署:Qwen2.5与DeepSeek-R1-Distill-Qwen实战指南
基于vLLM高效部署:Qwen2.5与DeepSeek-R1-Distill-Qwen实战指南
2025-06-12 12:07:15
1616
原创 《深度解析:如何在PyTorch中实现.pt模型文件与.bin二进制格式的高效转换》
PyTorch模型文件格式 .pt 与二进制格式 .bin 转换
2025-03-05 20:19:52
2280
原创 面向多模态检索的向量数据库对比分析和技术选型:Elasticsearch、Milvus、Pinecone、FAISS、Chroma、PGVector、Weaviate、Qdrant
面向多模态检索的向量数据库对比分析和技术选型:Elasticsearch、Milvus、Pinecone、FAISS、Chroma、PGVector、Weaviate、Qdrant
2025-03-05 20:08:33
4872
原创 NVIDIA GPU 架构详解:Pascal、Volta、Turing、Ampere、Ada、Hopper、Blackwell
NVIDIA 的 GPU 架构持续演进,每一代都在计算能力、能效比和专用硬件加速方面取得突破。以下是主流架构的核心特性对比与应用场景分析。
2025-03-03 20:44:50
17694
原创 深度解读 Chinese CLIP 论文:开启中文视觉对比语言预训练
本文提出了 Chinese CLIP,这是一个专为中文设计的视觉 - 语言基础模型。构建了一个包含约 2 亿个样本的预训练数据集,并使用所提出的两阶段预训练方法对一系列 Chinese CLIP 模型进行预训练,提高了预训练的效率和效果。Chinese CLIP 在多个跨模态检索数据集上,无论是零样本学习还是微调设置下,都能达到最先进的性能,在 10 个数据集的零样本图像分类任务中,也能取得颇具竞争力的成绩。
2025-02-27 21:38:09
1708
原创 深度解读 CLIP 论文:从自然语言监督中学习可迁移的视觉模型
本文深度讲解对比语言 - 图像预训练(CLIP)模型,该模型通过自然语言监督学习可迁移视觉模型,在多领域展现潜力,也分析了模型的性能、局限和社会影响
2025-02-26 19:48:04
1204
ClassProjectCity-C++实现课程设计源码资源.zip
2022-04-20
项目实战-KNN算法实现手写数字识别源码及数据集.zip
2022-04-17
项目实战-KNN算法改进约会网站的配对效果源码及数据集.zip
2022-04-17
项目实战-朴素贝叶斯算法实现新闻分类源码及数据集.zip
2022-04-17
项目实战-朴素贝叶斯算法实现垃圾邮件过滤源码及数据集.zip
2022-04-17
NASA MDP 软件缺陷数据集.zip
2022-04-16
Linux环境下编译的TensorFlow C++ API动态库文件.7z
2022-04-16
CNNVD 软件安全漏洞数据集.zip
2022-04-16
NVD 软件安全漏洞数据集.zip
2022-04-16
NSL-KDD 入侵检测数据集.zip
2022-04-16
KDD99入侵检测数据预处理和分类源代码及数据集.zip
2022-04-16
XGBoost与LightGBM文本分类源代码及数据集.zip
2022-04-16
项目实战-英文文本分类电影评论情感判别源码及数据集
2022-04-09
中文句子类型分类工具及数据集.zip
2022-04-09
项目实战-Bert文本分类(keras-bert实现)源代码及数据集.zip
2022-04-09
项目实战-TextCNN文本分类(keras实现)源代码及数据集.zip
2022-04-09
项目实战-中文商品评论情感分析源代码及数据集.zip
2022-04-09
社交网络影响力最大化(Python实现)及Wiki-Vote数据集
2022-04-08
LSTM实现对股票数据进行预测(Keras实现)源代码及数据集
2022-04-09
Python3对股票数据进行分析源代码和股票数据集
2022-04-09
CNN卷积神经网络实现Mnist手写数字识别数据集
2018-05-26
pyltp_wheel安装包.7z
2019-11-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅