自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(54)
  • 收藏
  • 关注

原创 LLM学习之路-02-第二章-部署与推理/vLLM使用PagedAttention轻松、快速且廉价地提供LLM服务(中文版翻译)

vLLM: 使用PagedAttention轻松、快速且廉价地提供LLM服务(中文翻译)

2025-04-23 10:15:00 1312

原创 LLM学习之路-02-第二章-部署与推理/DevOps,AIOps,MLOps,LLMOps,这些Ops都是什么?

DevOps, AIOps, MLOps, LLMOps,这些Ops都是什么?也许你会在很多地方看到这些词,或许AIOps和MLOps还会搞混淆,下面我们来一一解释这些Ops的含义,在开始之前,我们先了解一下CI/CD.

2025-04-23 10:00:00 957

原创 LLM学习之路-02-第二章-部署与推理/10分钟私有化部署大模型到本地

Ollama是一个开源的大型语言模型(LLM)服务工具,它旨在简化在本地运行大语言模型的过程,降低使用大语言模型的门槛。它允许开发者、研究人员和爱好者在本地环境中快速实验、管理和部署最新的大语言模型,包括但不限于Qwen2、Llama3、Phi3、Gemma2等开源的大型语言模型。Chatbox AI 是一款 AI 客户端应用和智能助手,支持众多先进的 AI 模型和 API,可在 Windows、MacOS、Android、iOS、Linux 和网页版上使用。在Ollama的模型仓库。

2025-04-22 13:10:42 762

原创 LLM学习之路-01-第一章-预训练/神经网络的激活函数(六)GELU和Mish

GELU函数的数学表达式为:x 是输入。其中,是误差函数。Mish激活函数的数学表达式为:是Softplus函数。tanh⁡(x) 是双曲正切函数。

2025-04-22 10:15:00 804

原创 LLM学习之路-01-第一章-预训练/神经网络的激活函数(五)门控系列-GLU、Swish和SwiGLU

GLU函数的数学表达式为:其中 ⊗ 表示逐元素乘法,X 是输入,W 和 V 是权重矩阵,b 和 c 是偏置项。Swish函数的数学表达式为:x 是输入。σ 是Sigmoid函数,定义为。β 是一个可学习的参数,控制函数的形状。SwiGLU函数的数学表达式为:a 和 b 是输入张量。Swish(x)=x⋅σ(x) 是Swish激活函数。是Sigmoid激活函数。⊗ 表示逐元素乘法(Hadamard乘积)。

2025-04-22 10:00:00 1439

原创 LLM学习之路-01-第一章-预训练/神经网络的激活函数(四)ELU和它的变种SELU

ELU的数学表达式为:其中,是一个超参数,通常取值为1。SELU的数学表达式为:其中,α≈1.67326λ≈1.0507。

2025-04-21 20:31:00 648

原创 LLM学习之路-01-第一章-预训练/神经网络的激活函数(三)ReLU和它的变种

ReLU(Rectified Linear Unit,修正线性单元)激活函数是现代深度学习中最常用的激活函数之一。Leaky ReLU的数学表达式为:其中,是一个小的正数,通常取值在0.01左右。PReLU的数学表达式为:其中,是一个可学习的参数,而不是一个固定的常数。

2025-04-21 20:27:11 804

原创 LLM学习之路-01-第一章-预训练/神经网络的激活函数(二)Sigmiod、Softmax和Tanh

给定一个包含个实数的向量 ,Softmax函数将其转换为一个概率分布Tanh函数(双曲正切函数)是一个常见的激活函数,广泛应用于神经网络和机器学习中。它的数学表达式为:Tanh函数的导数可以表示为:这意味着在输入值接近 −1 或 1 时,导数值接近0,而在输入值接近0时,导数值接近1今天我们介绍了三个古老的激活函数,它们在神经网络中仍然有着广泛的应用。Sigmoid函数作为一种非线性函数,可以引入非线性变换,增加神经网络的表达能力;

2025-04-21 20:22:06 765

原创 LLM-01-第一章-预训练/神经网络的激活函数(一)概述

神经网络的激活函数(一)概述

2025-03-23 22:32:07 688 1

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(十二)RAdam

神经网络的优化器(十二)RAdam

2025-03-22 10:00:00 603

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(十一)AdamW

神经网络的优化器(十一)AdamW

2025-03-21 10:15:00 694

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(十)Nadam

神经网络的优化器(十)Nad

2025-03-21 10:00:00 268

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(九)Adam

神经网络的优化器(九)Adam

2025-03-18 10:15:00 1486

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(八)RMSprop

神经网络的优化器(八)RMSprop

2025-03-18 10:00:00 253

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(七)AdaDeleta

神经网络的优化器(七)AdaDeleta

2025-03-17 10:15:00 518

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(六)AdaGrad

神经网络的优化器(六)AdaGrad

2025-03-17 10:00:00 1103

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(五)Rprop

神经网络的优化器(五)Rprop

2025-03-16 17:28:50 310

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(四)ASGD

神经网络的优化器(四)ASGD

2025-03-16 10:00:00 556

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(三)Momentum

神经网络的优化器(三)Momentum

2025-03-15 10:15:00 800

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(二)SGD

神经网络的优化器(二)SGD

2025-03-15 10:00:00 1568

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(一)概述

神经网络的优化器(一)概述

2025-03-14 20:08:32 863

原创 LLM学习之路-01-第一章-预训练/看懂FlashAttention需要的数学储备是?高考数学最后一道大题!

看懂FlashAttention需要的数学储备是?高考数学最后一道大题!

2025-03-14 20:00:35 854

原创 LLM学习之路-01-第一章-预训练/混合专家模型MoE详解节选

混合专家模型MoE详解节选

2025-03-13 10:15:00 1062

原创 LLM学习之路-01-第一章-预训练/最美的数学公式-欧拉公式

最美的数学公式-欧拉公式

2025-03-13 10:00:00 1066

原创 LLM学习之路-01-第一章-预训练/搞懂大模型的分词器(六)

搞懂大模型的分词器(六)

2025-03-12 10:15:00 478

原创 LLM学习之路-01-第一章-预训练/搞懂大模型的分词器(五)

搞懂大模型的分词器(五)

2025-03-11 20:33:35 383

原创 LLM学习之路-01-第一章-预训练/搞懂大模型的分词器(四)

搞懂大模型的分词器(四)

2025-03-11 10:15:00 778

原创 LLM学习之路-01-第一章-预训练/搞懂大模型的分词器(三)

搞懂大模型的分词器(三)

2025-03-11 10:00:00 320

原创 LLM学习之路-01-第一章-预训练/搞懂大模型的分词器(二)

搞懂大模型的分词器(二)

2025-03-10 10:15:00 476

原创 LLM-01-第一章-预训练/搞懂大模型的分词器(一)

搞懂大模型的分词器(一)

2025-03-10 10:00:00 1136

原创 LLM学习之路-01-第一章-预训练/大模型训练框架(五)Accelerate

大模型训练框架(五)Accelerate

2025-03-09 10:15:00 664

原创 LLM学习之路-01-第一章-预训练/大模型训练框架(四)Megatron-LM

大模型训练框架(四)Megatron-LM

2025-03-09 10:00:00 1415

原创 LLM学习之路-01-第一章-预训练/大模型训练框架(三)DeepSpeed

大模型训练框架(三)DeepSpeed

2025-03-08 10:15:00 589

原创 LLM学习之路-01-第一章-预训练/大模型训练框架(二)FSDP

大模型训练框架(二)FSDP

2025-03-08 10:00:00 660

原创 LLM学习之路-01-第一章-预训练/大模型训练框架(一)综述

大模型训练框架

2025-03-07 10:15:00 1035

原创 LLM学习之路-01-第一章-预训练/大模型并行策略[中文翻译]

大模型并行策略[

2025-03-07 10:00:00 1631

原创 LLM学习之路-01-第一章-预训练/大模型分布式训练并行技术(二)数据并行

大模型分布式训练并行技术

2025-03-06 10:00:00 622

原创 LLM学习之路-01-第一章-预训练/大模型分布式训练并行技术(三)流水线并行

大模型分布式训练并行技术

2025-03-06 10:00:00 701

原创 LLM学习之路-01-第一章-预训练/大模型分布式训练并行技术(四)张量并行

大模型分布式训练并行技术(四)张量并行

2025-03-06 10:00:00 505

原创 LLM学习之路-01-第一章-预训练/大模型分布式训练并行技术(五)混合并行

大模型分布式训练并行技术(五)混合并行

2025-03-06 10:00:00 268

AndroidStudio垃圾分类app

内含全部代码和apk,,可直接下载使用

2025-03-04

图像识别,信用卡数字识别,含代码和示例图片,可直接运行

图像识别,信用卡数字识别,含代码和示例图片,可直接运行

2025-03-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除