自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

扶着老奶奶闯红灯

会当水击三千里,自信人生二百年。

  • 博客(65)
  • 收藏
  • 关注

原创 【sglang模型部署】sglang部署embedding模型之gte-Qwen2-7B-instruct,然后接入dify知识库,做RAG系统。

【sglang模型部署】sglang部署embedding模型之gte-Qwen2-7B-instruct,然后接入dify知识库,做RAG系统。

2025-04-01 13:08:38 157

原创 【sglang】sglang出现如下报错sglang/srt/server.py“, line 631, in _wait_and_warmup assert res.status_code

【sglang】sglang出现如下报错sglang/srt/server.py", line 631, in _wait_and_warmup assert res.status_code

2025-03-11 10:28:08 106

原创 【GPU使用】如何在物理机和Docker中指定GPU进行推理和训练

如何在物理机和Docker中指定GPU进行推理和训练,我的机器上有4张H100卡,我现在只想用某一张卡跑程序,该如何设置。无法 import 某个package。

2025-03-03 17:10:08 357

原创 【大模型评测】如何评测大模型,大语言模型(LLMs)的评测框架、方法与挑战。当前主流评测基准(如GLUE、SuperGLUE)存在数据泄露、任务适配性不足及主观性缺失等局限性,未来需聚焦动态推理。

大语言模型(LLMs)的评测框架、方法与挑战。当前主流评测基准(如GLUE、SuperGLUE)存在数据泄露、任务适配性不足及主观性缺失等局限性,未来需聚焦动态推理、多轮对话和伦理安全等方向。

2025-03-01 17:01:57 1080

原创 【大模型】什么是蒸馏版大模型

什么是蒸馏版大模型

2025-03-01 16:51:14 616

原创 【大模型】fp32 和 fp16 的区别,混合精度的原理。

fp32 和 fp16 的区别,混合精度的原理。

2025-03-01 16:46:55 1023

原创 【DeepSeek】DeepSeek让教学效果翻倍!AI教学案例大揭秘

DeepSeek作为一款功能强大的AI大语言模型,在教育领域的应用场景广泛且深入,能够显著提升教师的工作效率和教学质量,并为教务系统的智能化升级提供技术支持。

2025-02-28 16:27:17 893

原创 【RAG】有了deepseek,为什么还要做RAG

【RAG】有了deepseek,为什么还要做RAG

2025-02-28 15:59:01 1030

原创 【DeepSeek部署】vllm部署deepseek,推理过程和答案分开。

vllm部署deepseek,推理过程和答案分开。推理模型会在输出中返回额外的 `reasoning_content` 字段,该字段包含导致最终结论的推理步骤。其他模型的输出中不存在此字段。

2025-02-28 11:20:05 1137

原创 【GPU机器数据传输】Linux系统中跨机器大规模数据传输,rsync | bbcp | scp | sftp 对比。

我们在训练大模型的时候,需要在Linux系统中传输超大量数据,选择合适的方法需综合考虑传输速度、可靠性、网络环境及数据特性。Linux系统中跨机器大规模数据传输,rsync | bbcp | scp | sftp 对比。

2025-02-27 16:15:11 877

原创 【DeepSeek】DeepSeek 如何应用于政务系统?

DeepSeek作为一款高性能、低成本的AI大模型,近期在政务系统中得到了广泛应用,其技术能力和场景适配性正在推动数字政府的智能化转型。以下从应用场景、技术支撑、实际成效及未来方向等方面进行深度解析

2025-02-18 17:45:19 2647

原创 【Grok 3】Grok 3 的推理和多模态能力能超越DeepSeek吗?

Grok 3 是由马斯克旗下的xAI公司开发的最新AI模型,于2025年2月17日正式发布。其推理能力据称将超越包括ChatGPT和DeepSeek在内的其他领先AI模型。Grok 3引入了“思维链”(Chain of Thought)推理能力,使其能够像人类一样逐步处理复杂任务,显著提高了模型处理复杂查询和提供更连贯、更有逻辑的响应能力。此外,Grok 3在多模态功能方面也有显著提升,包括推理、编程能力以及文本和图像分析等。

2025-02-18 10:55:40 1112

原创 【大模型参数】Temperature的具体含义

利用大模型的API时,我们可以配置一些参数来改进大模型的生成效果。比如`temperature`、`top_p`、`max_tokens`、`stop`、`frequency_penalty`、`presence_penalty`等。那么这些参数究竟具有什么意义呢?

2025-02-14 15:49:32 505

原创 【大语言模型】在大语言模型中,user、assistant、system 三种角色的定位和功能有何不同。

在大语言模型(如GPT系列)中,user、assistant、system 是三种核心角色,它们的定位和功能不同,共同构成对话的上下文结构。

2025-02-13 17:54:01 1710

原创 【DeepSeek变现】普通人怎么用deepseek捞到第一桶金

对于普通人而言,利用DeepSeek赚取第一桶金的核心在于结合AI工具的高效性与市场需求,聚焦轻资产、低门槛的变现路径。

2025-02-13 13:44:31 1686

原创 部署 DeepSeek R1各个版本所需硬件配置清单

DeepSeek-R1 通过其卓越的推理性能和灵活的训练机制,在 2025 年的春节期间受到了广泛关注。DeepSeek-R1 是一款高性能的 AI 推理模型,主要通过强化学习技术来增强模型在复杂任务场景下的推理能力。在本地部署 DeepSeek-R1 时,尤其是完整的 671b 参数版本,对硬件的需求相对较高

2025-02-13 09:44:31 14751

原创 【Ollama】DeepSeek-R1部署解决Ollama局域网内不能通过http访问

【Ollama】DeepSeek-R1部署解决Ollama局域网内不能通过http访问

2025-02-10 09:25:08 750

原创 【Pytorch函数】PyTorch随机数生成全解析 | torch.rand()家族函数使用指南

PyTorch随机数生成全解析 | torch.rand()家族函数使用指南

2025-02-09 16:38:47 617

原创 【DeepSeek使用技巧】解锁DeepSeek隐藏技能,从入门到精通的智能对话秘籍

【DeepSeek使用技巧】🌟 **DeepSeek超能指南:从入门到精通的智能对话秘籍** 🌟 *附20+即用型提示词模板,小白秒变AI驯兽师*

2025-02-09 15:37:58 467

原创 【人工智能】程序员技术变现指南:这20个宝藏工具让你2025年效率翻倍!

程序员技术变现指南:这20个宝藏工具让你2025年效率翻倍!"ChatGPT-5已能自动修Bug,你却还在手动写单元测试?淘汰你的不是AI,而是不会用AI工具的程序员!这份全网独家的开发者生存指南,让你用工具杠杆撬动10倍生产力!"

2025-02-09 14:35:26 873

原创 【Milvus】向量数据库pymilvus使用教程

【Milvus】向量数据库pymilvus使用教程

2025-02-08 18:01:26 1856

原创 【向量数据库】chroma 向量数据库使用教程

Chroma 是一个面向 AI 的开源嵌入式向量数据库,由 Ariel Kennan 和 Jack Altman 创立的两组不同人马合并而成。Chroma 提供了两个版本:免费的开源嵌入式版本和付费的托管和企业版本。

2025-02-07 17:55:40 1687 2

原创 【模型部署】大模型部署工具对比:SGLang, Ollama, VLLM, LLaMA.cpp如何选择?

大模型部署工具对比:SGLang, Ollama, VLLM, LLaMA.cpp如何选择。在选择大模型部署工具时,需要考虑多个因素,包括性能、支持的语言和模型、硬件支持、易用性以及社区支持等。

2025-02-07 10:23:09 4411

原创 采用streamlit 、 langchain 和 SGLang 如何部署 deepseek r1?

采用streamlit 、 langchain 和 SGLang 如何部署 deepseek r1?以下是采用Streamlit、LangChain和SGLang部署DeepSeek R1的一般步骤: 环境准备 安装必要的库和工具:确保安装了Streamlit、LangChain和SGLang,以及其他可能需要的依赖项,如Python的相关科学计算库等。 获取DeepSeek R1模型:从官方渠道或其他合法来源获取DeepSeek R1模型的相关文件和参数。

2025-02-06 18:06:19 1463

原创 DeepSeek r1的技术突破、商业模式及行业影响展开讨论,总结核心观点

DeepSeek r1展现了中国AI在资源受限下的高效突破,其技术路径与开源策略可能重塑行业格局,但长期需解决模型多样性、算力生态及多模态等挑战,方能在全球AI竞赛中持续领先。

2025-02-05 15:14:03 330

原创 DeepSeek-R1论文中英文对照版,技术细节 & 亮点

DeepSeek-R1论文中英文对照版,技术细节 & 亮点

2025-02-05 15:03:18 1383

原创 Total Params 是模型的“理论参数量”,反映整体复杂度; Activated Params 是“实际使用的参数量”,反映运行时效率。

Total Params 是模型的“理论参数量”,反映整体复杂度;Activated Params 是“实际使用的参数量”,反映运行时效率。在动态网络和稀疏计算场景中,二者差异显著,优化目标是最小化激活参数量,同时保持模型性能。

2025-02-05 11:25:42 1319

原创 强化学习中的 Reward Hacking 是什么意思?

Reward Hacking(奖励破解)是强化学习中的一个现象,指智能体通过利用奖励函数的设计缺陷,采取看似有效但实际违背设计者初衷的策略来最大化奖励。

2025-02-05 08:59:05 700

原创 DeepSeek-R1 技术报告

DeepSeek-R1 是 DeepSeek 团队推出的第一代专注推理能力的大语言模型系列,包含两个核心模型:DeepSeek-R1-Zero 和 DeepSeek-R1。两者的核心差异在于训练流程设计:(1) 纯强化学习驱动的推理涌现DeepSeek-R1-Zero 的突破性在于验证了 无需 SFT 的 RL 路径:(2) 冷启动与多阶段训练策略为解决 R1-Zero 的缺陷,R1 引入四阶段流程:(3) 高效蒸馏技术通过将 R1 的推理数据蒸馏至小模型,团队发现:DeepSeek-R1 通过 RL

2025-02-04 19:16:36 1393

原创 Baichuan-M1-14B-Instruct 部署踩坑

Baichuan-M1-14B-Instruct 部署。

2025-01-25 17:45:19 347

原创 Baichuan大模型Base、Chat、Instruct等版本的区别

Baichuan大模型作为国内领先的开源语言模型,其不同版本(如Base、Chat、Instruct等)在训练目标、应用场景和性能特点上存在显著差异

2025-01-25 13:48:02 665

原创 多模态大模型未来发展趋势:技术深化、应用拓展与治理挑战

多模态大模型(Multimodal Large Language Models, MLLMs)作为人工智能迈向通用智能(AGI)的关键路径,正通过整合文本、图像、音频、视频等多模态数据,重塑AI技术的边界

2025-01-25 12:03:53 1099

原创 2025年人工智能将渗透到人类生活的各个领域,您准备好了吗?

2025年,人工智能(AI)将以前所未有的深度和广度渗透到人类生活的各个领域,从工作方式到医疗健康,从日常生活到社会治理,其影响力将呈现多维度、多层次的变革。

2025-01-25 11:52:56 935

原创 2025年人工智能的发展趋势

2025年人工智能(AI)的发展将呈现多维度、深层次的变革,涵盖技术突破、行业应用、硬件创新、伦理治理等多个领域。以下结合最新行业动态与研究,总结2025年AI发展的核心方向。

2025-01-25 11:48:23 903

原创 想转行到人工智能领域,我该学什么,怎么学?

想转行到人工智能领域,我该学什么,怎么学?

2025-01-24 12:27:17 1475

原创 PyTorch API 详细中文文档,基于PyTorch2.5

PyTorch API 详细中文文档,基于PyTorch2.5

2025-01-24 11:54:33 2090

原创 Anaconda 安装以及命令总结文档

Anaconda 安装以及命令总结文档

2025-01-24 11:22:59 420

原创 pytorch2.5实例教程

pytorch2.5实例教程

2025-01-24 10:50:44 1240

原创 SGLang安装教程,部署你的大模型,性能比vllm好,实现张量并行,数据并行,加快推理速度,亲测效果好。

SGLang安装教程,部署你的大模型,性能比vllm好,实现张量并行,数据并行,加快推理速度,亲测效果好。目前大模型部署工具主要是vllm,最近出现了SGLang,很多新开源大模型都支持SGLang的部署推理,例如deepseek-R1,Qwen2.5,Mistral,GLM-4,MiniCPM 3,InternLM 2, Llama 3.2等。

2025-01-23 11:50:20 12650 17

原创 2025大模型MiniCPM-o 2.6部署 & 测试,记录我踩过的坑坑,ImportError: flash_attn. Run `pip install flash_attn`

MiniCPM-o 是从 MiniCPM-V 升级的最新端侧多模态大模型系列。该系列模型可以以端到端方式,接受图像、视频、文本、音频作为输入,并生成高质量文本和语音输出。

2025-01-23 10:01:47 826 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除