自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(65)
  • 收藏
  • 关注

原创 Dify 源码升级指南

本文详细介绍了Dify系统的升级流程。首先强调备份的重要性,提供了完整备份和选择性备份(包括docker-compose.yaml、.env文件和volumes数据)两种方案。升级步骤包括:1)获取最新代码;2)替换文件并恢复数据;3)启动服务。特别针对可能出现的数据库连接错误,给出了使用--profile postgresql参数的解决方案。

2025-12-19 15:11:15 670

原创 Python脚本打包成可执行文件完整指南:使用PyInstaller实现跨平台部署

本文介绍了使用PyInstaller将Python脚本打包为独立可执行文件的方法。针对需要部署到无Python环境服务器的场景,详细说明了从配置外部化、依赖管理到打包的全过程。

2025-12-17 10:56:04 739

原创 Dify服务部署指南

Dify是一个开源的大语言模型应用开发平台,支持快速构建AI应用。本文详细介绍了Dify的部署流程。

2025-12-09 16:13:00 932

原创 ollama 预加载的模型未加载到GPU上问题方案详解

针对Ubuntu系统重启后Ollama服务无法自动使用GPU的问题,提出三种解决方案:1)优化启动脚本增加GPU驱动就绪检查;2)配置Systemd服务确保GPU初始化完成后再启动容器;3)调整Docker启动参数确保正确挂载GPU。

2025-12-08 11:35:18 816

原创 ollama 容器部署映射端口号修改

本文介绍了Ollama服务的端口查看与修改方法。默认情况下,Ollama监听11434端口,可通过netstat或ss命令确认。修改端口需编辑/etc/systemd/system/ollama.service文件,在[Service]部分添加OLLAMA_HOST环境变量(如0.0.0.0:11435)。修改后需重启服务并验证新端口是否生效。

2025-12-05 17:31:28 639

原创 Docker 镜像源配置指南

本文介绍了如何修改Docker镜像源以提升国内镜像拉取速度。

2025-12-02 13:21:23 655

原创 设置 Ollama 容器自动重启和模型自动加载的方法

本文介绍了两种实现Docker容器自动启动的方法,以及针对模型加载问题,提出了自动加载脚本方案。

2025-11-24 10:33:13 704

原创 LaTeX公式完全指南:从入门到精通

LaTeX是一种专业的排版系统,专门用于科技文档和数学公式的排版。文章详细介绍了LaTeX的基本用法。

2025-11-06 06:00:00 1425

原创 深入解析Milvus挂载卷:etcd, minio, milvus三大文件夹

Milvus核心文件夹解析:etcd、minio、milvus功能详解。Milvus数据库中的etcd、minio和milvus三个核心文件夹分别承担元数据存储、数据仓库和运行记录的关键角色。etcd作为"大脑"存储所有元数据,minio作为"仓库"保存实际向量数据,而milvus则记录系统运行日志和配置。

2025-11-05 07:00:00 1574

原创 LangGraph 实战(三):添加记忆功能

本文介绍了如何为聊天机器人添加记忆功能,使其能够记住对话历史。通过使用LangGraph的MemorySaver类,实现了状态的保存和恢复。

2025-11-05 06:00:00 821

原创 LangGraph 实战(二):添加工具使用能力

本文介绍了如何通过集成Tavily搜索API来增强聊天机器人的外部知识获取能力。修改后的聊天机器人能够自动识别需要外部信息的问题,调用搜索工具获取结果,并生成基于真实网络信息的回答。

2025-11-04 07:00:00 1502

原创 LangGraph 实战(一):构建一个基础的聊天机器人

本文介绍了如何使用LangGraph构建一个基于DeepSeek大模型的简单聊天机器人。详细说明了构建过程:定义状态类、初始化DeepSeek模型、创建节点函数以及构建状态图结构。最后实现了一个支持流式响应的命令行交互程序,用户可以通过输入文字与机器人对话。该示例展示了LangGraph的核心概念和工作流程,为开发更复杂应用奠定了基础。

2025-11-04 06:00:00 689

原创 DeepSeek-OCR 深度解析

DeepSeek团队开源的DeepSeek-OCR模型创新性地将文本"画"成图像处理,实现高效信息压缩。该模型通过局部感知和全局压缩的双阶段设计,能将1000个文本Token压缩为100个视觉Token并保持97%的OCR精度,显著提升长文本处理效率。

2025-11-03 15:07:13 977

原创 优快云 删除所上传的资源

本文介绍了删除优快云已上传资源的具体方法。

2025-11-03 11:03:05 227

原创 linux 工具

本文介绍了在Linux和Windows系统中安装可用工具的步骤。

2025-11-03 09:46:38 163

原创 Docker vs Conda:环境管理的两大神器

本文深入对比Python开发中常用的环境管理工具Conda和Docker。

2025-10-31 17:54:54 1259

原创 LangGraph vs CrewAI vs OpenAI Swarm:三大AI框架

LangGraph是一款专为构建复杂AI工作流设计的开源框架,采用图结构建模组件关系,支持持久执行、人机协作和全面记忆管理等核心功能;CrewAI强调人机协作易用性,适合团队任务自动化;OpenAI Swarm则擅长大规模数据处理。

2025-10-31 16:59:48 551

原创 Transformer与CNN的本质区别:从局部感知到全局洞察的演进

CNN与Transformer的核心差异分析:CNN采用局部连接和权重共享,通过层级结构逐步扩大感受野,适用于图像处理等局部相关性强的任务;Transformer依靠自注意力机制直接建立全局关联,擅长处理序列数据中的长距离依赖。

2025-10-30 11:24:52 1185

原创 FastChat 框架部署 BGE 模型

本文介绍使用 FastChat 框架部署一个兼容 OpenAI API 接口的 BGE 模型的完整流程,以及使用 FastChat 框架进行部署的原因、优势。

2025-10-30 10:05:08 977

原创 curl: (77) error setting certificate verify locations

当使用curl命令时出现"(77) error setting certificate verify locations"报错,通常是由于Anaconda自带的curl使用了不完整的CA证书路径。

2025-10-22 17:01:43 551

原创 UV工具安装配置使用教程

Astral公司推出的uv是一款集成化Python工具,旨在替代pip、virtualenv等传统工具链,统一管理环境、依赖和运行隔离。

2025-10-22 16:28:34 1316

原创 ModuleNotFoundError: No module named ‘pyairports‘

本文记录了在UV环境中部署Qwen2.5-7B大模型时遇到的"ModuleNotFoundError: No module named 'pyairports'"错误及解决方案。

2025-10-16 06:00:00 2910 3

原创 【深度解析】三大Transformer架构:Encoder-only、Decoder-only与Encoder-Decoder

NLP三大模型架构解析:Transformer衍生出的Encoder-only、Decoder-only和Encoder-Decoder三大主流架构各具特色。

2025-10-01 06:00:00 1156

原创 大语言模型“记忆功能”探讨

大模型通过上下文窗口实现短期记忆功能,其工作原理基于自回归生成和注意力机制。然而,这种记忆具有严重局限性:容量限制导致信息丢失、注意力偏向开头和结尾内容、不同会话间完全隔离。

2025-10-01 06:00:00 528

原创 Function Call 原理详解

FunctionCalling是大语言模型(如GPT-3.5、GPT-4)的重要特性,允许模型智能调用外部工具或API,扩展其能力以完成实时数据获取、计算、数据库交互等任务。

2025-09-30 14:48:26 1306

原创 大模型分词器原理详解

大模型分词器是LLM的核心组件,负责将文本转换为模型可处理的数字Token。它通过子词分割算法(BPE、WordPiece、Unigram等)解决词汇无限性和未登录词问题,在字符与单词间取得平衡。

2025-09-30 14:33:10 943

原创 详解LLM中的 Prefill(预填充)计算阶段

本文介绍了大语言模型推理中的Prefill阶段及其与Decoding阶段的区别。

2025-09-26 15:51:27 1449

原创 使用 curl 调用 url 接口的完整示例与解析

本文介绍了使用curl工具调用接口的完整流程,重点解决本地文件需要转为URL的问题。

2025-09-25 09:52:37 863

原创 不同版本tensorflow推理报错解决方法

本文探讨了TensorFlow模型在不同CUDA和TensorFlow版本环境下的兼容性问题。

2025-09-19 16:11:56 1039 1

原创 BGE-m3 和 BCE-Embedding 模型对比分析

BGE-m3和BCE-Embedding各有优势,BGE-m3在多语言支持(100+语言)、长文本处理(8192tokens窗口)和高密度检索(跨语言检索提升15%)方面表现突出;BCE-Embedding则在垂直领域优化、轻量化部署(110M参数,推理速度提升40%)和中文语义理解(成语/古汉语准确率更高)更具优势。

2025-09-12 14:47:45 268

原创 温度预测算法评价指标详解:从理论到实践的全面指南

本文系统介绍了7种温度预测模型的核心评价指标及其应用。主要包括MSE、RMSE、MAE、R²、MAPE、MedianAE和MaxError,从理论定义、数学公式到实际案例和Python实现进行了详细说明。

2025-09-12 14:12:54 1062

原创 解决 Ubuntu 环境下 ffmpeg 安装依赖问题(FileNotFoundError: ffprobe 错误处理)

本文介绍了解决pydub音频处理时出现"FileNotFoundError:ffprobe"错误的多种解决方法。

2025-08-25 16:16:32 749

原创 《GPT-OSS 模型全解析:OpenAI 回归开源的 Mixture-of-Experts 之路》

OpenAI推出开源大模型GPT-OSS系列,包含120B和20B两个版本,采用Apache2.0协议。模型采用MoE架构和MXFP4量化技术,支持131K长上下文和高效推理。部署方式涵盖vLLM、Transformers等多种方案,提供兼容OpenAI的API接口。该系列在MMLU等测试中表现优异,为开发者提供强大的开源AI工具。

2025-08-20 14:45:02 1288

原创 检索系统评测指标详解:从理论到实践

本文系统介绍了信息检索系统中的关键评测指标。基础指标包括Recall@K(召回率)、Precision@K(精确率)、MRR(平均倒数排名)和NDCG@K(归一化折扣累积收益),分别衡量检索的全面性、准确性、速度和排序质量。高级指标涵盖DiversityScore(多样性分数)和CoverageScore(覆盖度分数),用于评估结果的丰富性和去重效果。

2025-08-07 06:00:00 1391

原创 RAG中的三大召回方式详解

本文介绍了三种RAG系统中常用的召回策略:1)BM25稀疏召回,基于词频统计的快速检索方法,适合文档匹配但缺乏语义理解;2)BCE向量召回,通过双塔模型实现语义搜索,效果更好但需要训练数据;3)关键词召回,基于规则匹配的简单方法,适合结构化场景但扩展性差。三种方法各具特点,可根据实际场景需求选择使用,其中BM25适合通用检索,BCE适合语义搜索,关键词召回则适用于规则明确的垂直领域。

2025-08-06 06:00:00 1400

原创 深入剖析 RAG 检索系统中的召回方式:BM25、向量召回、混合策略全解析

RAG(检索增强生成)系统通过结合信息检索与文本生成技术提升大模型回答的准确性。其中,召回作为第一步,直接影响系统性能。本文系统介绍了三种核心召回方式:基于关键词匹配的BM25稀疏召回、利用语义向量的BCE稠密召回,以及融合两者的混合召回。

2025-08-05 14:04:02 2510

原创 【RAG 检索排序详解】RRF vs Reranker:原理、区别与实战应用

RRF(Reciprocal Rank Fusion) 和 Reranker(重排序器)的区别、适用场景及如何结合使用。

2025-08-01 13:47:17 2059

原创 Qwen3 模型本地部署与应用

阿里推出第三代Qwen3大模型系列,包含8个参数规模从0.6B到235B的密集型和MoE模型,支持多模态输入和128K超长上下文。

2025-08-01 09:57:17 1308

原创 Ollama安装及使用Ollama部署大模型

Ollama是一个开源本地大语言模型运行平台,支持Docker部署和API调用。

2025-07-29 14:51:14 1486

原创 Git常用命令赏析

本文提供 Git 版本控制系统的全面使用指南,包含 26 个章节的核心内容: 基础操作、工作流核心、高级功能、性能优化、安全措施、工作流实践、疑难解决等。

2025-07-25 10:05:40 1249

Cursor-1.5.11-x86-64.AppImage

Cursor-1.5.11-x86_64 版本安装包。

2025-11-03

linux-utils

linux 工具,可用于帮助提高工作效率。

2025-11-03

WeChatLinux

Linux系统上微信安装。

2025-07-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除