深度求索者-优快云博客

原创【sglang模型部署】sglang部署embedding模型之gte-Qwen2-7B-instruct，然后接入dify知识库，做RAG系统。

【sglang模型部署】sglang部署embedding模型之gte-Qwen2-7B-instruct，然后接入dify知识库，做RAG系统。

2025-04-01 13:08:38 157

原创【sglang】sglang出现如下报错sglang/srt/server.py“, line 631, in _wait_and_warmup assert res.status_code

【sglang】sglang出现如下报错sglang/srt/server.py", line 631, in _wait_and_warmup assert res.status_code

2025-03-11 10:28:08 106

原创【GPU使用】如何在物理机和Docker中指定GPU进行推理和训练

如何在物理机和Docker中指定GPU进行推理和训练，我的机器上有4张H100卡，我现在只想用某一张卡跑程序，该如何设置。无法 import 某个package。

2025-03-03 17:10:08 357

原创【大模型评测】如何评测大模型，大语言模型（LLMs）的评测框架、方法与挑战。当前主流评测基准（如GLUE、SuperGLUE）存在数据泄露、任务适配性不足及主观性缺失等局限性，未来需聚焦动态推理。

大语言模型（LLMs）的评测框架、方法与挑战。当前主流评测基准（如GLUE、SuperGLUE）存在数据泄露、任务适配性不足及主观性缺失等局限性，未来需聚焦动态推理、多轮对话和伦理安全等方向。

2025-03-01 17:01:57 1080

原创【大模型】fp32 和 fp16 的区别，混合精度的原理。

fp32 和 fp16 的区别，混合精度的原理。

2025-03-01 16:46:55 1023

原创【DeepSeek】DeepSeek让教学效果翻倍！AI教学案例大揭秘

DeepSeek作为一款功能强大的AI大语言模型，在教育领域的应用场景广泛且深入，能够显著提升教师的工作效率和教学质量，并为教务系统的智能化升级提供技术支持。

2025-02-28 16:27:17 893

原创【RAG】有了deepseek，为什么还要做RAG

【RAG】有了deepseek，为什么还要做RAG

2025-02-28 15:59:01 1030

原创【DeepSeek部署】vllm部署deepseek，推理过程和答案分开。

vllm部署deepseek，推理过程和答案分开。推理模型会在输出中返回额外的 `reasoning_content` 字段，该字段包含导致最终结论的推理步骤。其他模型的输出中不存在此字段。

2025-02-28 11:20:05 1137

原创【GPU机器数据传输】Linux系统中跨机器大规模数据传输，rsync | bbcp | scp | sftp 对比。

我们在训练大模型的时候，需要在Linux系统中传输超大量数据，选择合适的方法需综合考虑传输速度、可靠性、网络环境及数据特性。Linux系统中跨机器大规模数据传输，rsync | bbcp | scp | sftp 对比。

2025-02-27 16:15:11 877

原创【DeepSeek】DeepSeek 如何应用于政务系统？

DeepSeek作为一款高性能、低成本的AI大模型，近期在政务系统中得到了广泛应用，其技术能力和场景适配性正在推动数字政府的智能化转型。以下从应用场景、技术支撑、实际成效及未来方向等方面进行深度解析

2025-02-18 17:45:19 2647

原创【Grok 3】Grok 3 的推理和多模态能力能超越DeepSeek吗？

Grok 3 是由马斯克旗下的xAI公司开发的最新AI模型，于2025年2月17日正式发布。其推理能力据称将超越包括ChatGPT和DeepSeek在内的其他领先AI模型。Grok 3引入了“思维链”（Chain of Thought）推理能力，使其能够像人类一样逐步处理复杂任务，显著提高了模型处理复杂查询和提供更连贯、更有逻辑的响应能力。此外，Grok 3在多模态功能方面也有显著提升，包括推理、编程能力以及文本和图像分析等。

2025-02-18 10:55:40 1112

原创【大模型参数】Temperature的具体含义

利用大模型的API时，我们可以配置一些参数来改进大模型的生成效果。比如`temperature`、`top_p`、`max_tokens`、`stop`、`frequency_penalty`、`presence_penalty`等。那么这些参数究竟具有什么意义呢？

2025-02-14 15:49:32 505

原创【大语言模型】在大语言模型中，user、assistant、system 三种角色的定位和功能有何不同。

在大语言模型（如GPT系列）中，user、assistant、system 是三种核心角色，它们的定位和功能不同，共同构成对话的上下文结构。

2025-02-13 17:54:01 1710

原创【DeepSeek变现】普通人怎么用deepseek捞到第一桶金

对于普通人而言，利用DeepSeek赚取第一桶金的核心在于结合AI工具的高效性与市场需求，聚焦轻资产、低门槛的变现路径。

2025-02-13 13:44:31 1686

原创部署 DeepSeek R1各个版本所需硬件配置清单

DeepSeek-R1 通过其卓越的推理性能和灵活的训练机制，在 2025 年的春节期间受到了广泛关注。DeepSeek-R1 是一款高性能的 AI 推理模型，主要通过强化学习技术来增强模型在复杂任务场景下的推理能力。在本地部署 DeepSeek-R1 时，尤其是完整的 671b 参数版本，对硬件的需求相对较高

2025-02-13 09:44:31 14751

原创【Ollama】DeepSeek-R1部署解决Ollama局域网内不能通过http访问

【Ollama】DeepSeek-R1部署解决Ollama局域网内不能通过http访问

2025-02-10 09:25:08 750

原创【Pytorch函数】PyTorch随机数生成全解析 | torch.rand()家族函数使用指南

PyTorch随机数生成全解析 | torch.rand()家族函数使用指南

2025-02-09 16:38:47 617

原创【DeepSeek使用技巧】解锁DeepSeek隐藏技能，从入门到精通的智能对话秘籍

【DeepSeek使用技巧】🌟 **DeepSeek超能指南：从入门到精通的智能对话秘籍** 🌟 *附20+即用型提示词模板，小白秒变AI驯兽师*

2025-02-09 15:37:58 467

原创【人工智能】程序员技术变现指南：这20个宝藏工具让你2025年效率翻倍！

程序员技术变现指南：这20个宝藏工具让你2025年效率翻倍！"ChatGPT-5已能自动修Bug，你却还在手动写单元测试？淘汰你的不是AI，而是不会用AI工具的程序员！这份全网独家的开发者生存指南，让你用工具杠杆撬动10倍生产力！"

2025-02-09 14:35:26 873

原创【Milvus】向量数据库pymilvus使用教程

【Milvus】向量数据库pymilvus使用教程

2025-02-08 18:01:26 1856

原创【向量数据库】chroma 向量数据库使用教程

Chroma 是一个面向 AI 的开源嵌入式向量数据库，由 Ariel Kennan 和 Jack Altman 创立的两组不同人马合并而成。Chroma 提供了两个版本：免费的开源嵌入式版本和付费的托管和企业版本。

2025-02-07 17:55:40 1687 2

原创【模型部署】大模型部署工具对比：SGLang, Ollama, VLLM, LLaMA.cpp如何选择？

大模型部署工具对比：SGLang, Ollama, VLLM, LLaMA.cpp如何选择。在选择大模型部署工具时，需要考虑多个因素，包括性能、支持的语言和模型、硬件支持、易用性以及社区支持等。

2025-02-07 10:23:09 4411

原创采用streamlit 、 langchain 和 SGLang 如何部署 deepseek r1？

采用streamlit 、 langchain 和 SGLang 如何部署 deepseek r1？以下是采用Streamlit、LangChain和SGLang部署DeepSeek R1的一般步骤：环境准备安装必要的库和工具：确保安装了Streamlit、LangChain和SGLang，以及其他可能需要的依赖项，如Python的相关科学计算库等。获取DeepSeek R1模型：从官方渠道或其他合法来源获取DeepSeek R1模型的相关文件和参数。

2025-02-06 18:06:19 1463

原创 DeepSeek r1的技术突破、商业模式及行业影响展开讨论，总结核心观点

DeepSeek r1展现了中国AI在资源受限下的高效突破，其技术路径与开源策略可能重塑行业格局，但长期需解决模型多样性、算力生态及多模态等挑战，方能在全球AI竞赛中持续领先。

2025-02-05 15:14:03 330

原创 DeepSeek-R1论文中英文对照版，技术细节 & 亮点

DeepSeek-R1论文中英文对照版，技术细节 & 亮点

2025-02-05 15:03:18 1383

原创 Total Params 是模型的“理论参数量”，反映整体复杂度； Activated Params 是“实际使用的参数量”，反映运行时效率。

Total Params 是模型的“理论参数量”，反映整体复杂度；Activated Params 是“实际使用的参数量”，反映运行时效率。在动态网络和稀疏计算场景中，二者差异显著，优化目标是最小化激活参数量，同时保持模型性能。

2025-02-05 11:25:42 1319

原创强化学习中的 Reward Hacking 是什么意思？

Reward Hacking（奖励破解）是强化学习中的一个现象，指智能体通过利用奖励函数的设计缺陷，采取看似有效但实际违背设计者初衷的策略来最大化奖励。

2025-02-05 08:59:05 700

原创 DeepSeek-R1 技术报告

DeepSeek-R1 是 DeepSeek 团队推出的第一代专注推理能力的大语言模型系列，包含两个核心模型：DeepSeek-R1-Zero 和 DeepSeek-R1。两者的核心差异在于训练流程设计：(1) 纯强化学习驱动的推理涌现DeepSeek-R1-Zero 的突破性在于验证了无需 SFT 的 RL 路径：(2) 冷启动与多阶段训练策略为解决 R1-Zero 的缺陷，R1 引入四阶段流程：(3) 高效蒸馏技术通过将 R1 的推理数据蒸馏至小模型，团队发现：DeepSeek-R1 通过 RL

2025-02-04 19:16:36 1393

空空如也

空空如也