大模型
文章平均质量分 95
本专栏聚焦大模型相关技术与应用,实现从入门到实战的跨越,一起在大模型领域中学习进步!
Asia-Lee
技术探索,分享实践与思考!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
DeepSeek-OCR 部署、配置解析与测试完整指南
DeepSeek-OCR 是 DeepSeek-AI 提出的用于探索视觉 2D 映射压缩长上下文可行性的视觉语言模型(VLM),由DeepEncoder(核心编码器,~380M 参数)和DeepSeek3B-MoE-A570M 解码器(激活 570M 参数)构成;其核心优势在于 DeepEncoder 通过串联窗口注意力(SAM-base)、16× 卷积压缩器与全局注意力(CLIP-large),实现高分辨率输入下的低激活内存与高压缩比,实验显示在 Fox 基准上。原创 2025-11-10 19:00:40 · 2857 阅读 · 2 评论 -
深度解读 DeepSeek-OCR 论文:通过视觉模态实现高效文本压缩
DeepSeek-OCR 是 DeepSeek-AI 提出的用于探索视觉 2D 映射压缩长上下文可行性的视觉语言模型(VLM),由DeepEncoder(核心编码器,~380M 参数)和DeepSeek3B-MoE-A570M 解码器(激活 570M 参数)构成;其核心优势在于 DeepEncoder 通过串联窗口注意力(SAM-base)、16× 卷积压缩器与全局注意力(CLIP-large),实现高分辨率输入下的低激活内存与高压缩比,实验显示在 Fox 基准上。原创 2025-11-10 18:50:33 · 1470 阅读 · 0 评论 -
ReAct 与 Function Call:两种主流 Agent 技术解析与实践
在人工智能领域,Agent 技术正成为推动 AI 系统向主动推理、复杂任务处理演进的核心方向。本文将深入解析当前主流的两种 Agent 技术 ——ReAct(推理与行动协同框架)和Function Call(结构化功能调用),探讨其技术原理、应用场景及开发实践要点。原创 2025-11-03 19:23:11 · 1032 阅读 · 0 评论 -
详解混合检索中 RPF 排序算法(Reciprocal Rank Fusion)
RPF(Reciprocal Rank Fusion)排序算法作为一种高效的结果融合方法,能够有效整合多个检索系统的输出,生成更优的排序结果原创 2025-10-15 18:08:31 · 774 阅读 · 0 评论 -
从大模型到轻量级部署:知识蒸馏优化技术
知识蒸馏(Knowledge Distillation, KD)是一种模型压缩与优化技术,旨在将复杂高性能模型(教师模型,Teacher Model)的 “知识” 迁移到轻量模型(学生模型,Student Model)中,使学生模型在参数量和计算成本大幅降低的同时,尽可能保留教师模型的性能。原创 2025-10-10 18:31:02 · 436 阅读 · 0 评论 -
Dify 源码本地部署启动及完整步骤解析
Dify 源码本地部署启动及完整步骤解析原创 2025-09-29 19:04:54 · 1437 阅读 · 0 评论 -
Docker 快速部署 Dify + 应用构建完整流程
Dify 部署与应使用 Docker Compose 快速部署 Dify 用构建原创 2025-09-26 19:17:26 · 1741 阅读 · 2 评论 -
FastGPT极速上手指南:Docker容器化部署实战
使用 Docker Compose 快速部署 FastGPT 4.9.7版本原创 2025-06-23 20:56:37 · 2732 阅读 · 4 评论 -
知识库搜索新范式:FastGPT知识库搜索方案全解析
FastGPT 知识库结构设计,理解其 QA 的存储格式和多向量映射,以便更好的构建知识库原创 2025-06-23 19:56:54 · 1621 阅读 · 0 评论 -
RAG检索增强生成技术:原理剖析、应用场景与优劣对比
RAG检索增强生成:从理论到实践的应用与挑战检索增强生成(RAG)全面解析:原理、场景与优化方向原创 2025-06-18 20:59:50 · 884 阅读 · 0 评论 -
基于vLLM高效部署多模态大模型Qwen2.5-VL实战指南及优化策略
基于vLLM高效部署多模态大模型Qwen2.5-VL实战指南及优化策略原创 2025-06-18 20:12:09 · 5988 阅读 · 1 评论 -
通用对象定位与识别大模型GLEE:原理部署训练全流程解析与实战指南
通用对象定位与识别大模型GLEE:原理部署训练全流程解析与实战指南原创 2025-06-16 21:34:09 · 1280 阅读 · 0 评论 -
基于vLLM高效部署:Qwen2.5与DeepSeek-R1-Distill-Qwen实战指南
基于vLLM高效部署:Qwen2.5与DeepSeek-R1-Distill-Qwen实战指南原创 2025-06-12 12:07:15 · 1740 阅读 · 0 评论 -
面向多模态检索的向量数据库对比分析和技术选型:Elasticsearch、Milvus、Pinecone、FAISS、Chroma、PGVector、Weaviate、Qdrant
面向多模态检索的向量数据库对比分析和技术选型:Elasticsearch、Milvus、Pinecone、FAISS、Chroma、PGVector、Weaviate、Qdrant原创 2025-03-05 20:08:33 · 5281 阅读 · 0 评论
分享