自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(46)
  • 收藏
  • 关注

原创 LLM-01-第一章-预训练/神经网络的激活函数(一)概述

神经网络的激活函数(一)概述

2025-03-23 22:32:07 661 1

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(十二)RAdam

神经网络的优化器(十二)RAdam

2025-03-22 10:00:00 584

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(十一)AdamW

神经网络的优化器(十一)AdamW

2025-03-21 10:15:00 655

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(十)Nadam

神经网络的优化器(十)Nad

2025-03-21 10:00:00 240

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(九)Adam

神经网络的优化器(九)Adam

2025-03-18 10:15:00 1454

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(八)RMSprop

神经网络的优化器(八)RMSprop

2025-03-18 10:00:00 242

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(七)AdaDeleta

神经网络的优化器(七)AdaDeleta

2025-03-17 10:15:00 511

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(六)AdaGrad

神经网络的优化器(六)AdaGrad

2025-03-17 10:00:00 1088

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(五)Rprop

神经网络的优化器(五)Rprop

2025-03-16 17:28:50 298

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(四)ASGD

神经网络的优化器(四)ASGD

2025-03-16 10:00:00 549

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(三)Momentum

神经网络的优化器(三)Momentum

2025-03-15 10:15:00 780

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(二)SGD

神经网络的优化器(二)SGD

2025-03-15 10:00:00 1543

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(一)概述

神经网络的优化器(一)概述

2025-03-14 20:08:32 846

原创 LLM学习之路-01-第一章-预训练/看懂FlashAttention需要的数学储备是?高考数学最后一道大题!

看懂FlashAttention需要的数学储备是?高考数学最后一道大题!

2025-03-14 20:00:35 843

原创 LLM学习之路-01-第一章-预训练/混合专家模型MoE详解节选

混合专家模型MoE详解节选

2025-03-13 10:15:00 1048

原创 LLM学习之路-01-第一章-预训练/最美的数学公式-欧拉公式

最美的数学公式-欧拉公式

2025-03-13 10:00:00 1049

原创 LLM学习之路-01-第一章-预训练/搞懂大模型的分词器(六)

搞懂大模型的分词器(六)

2025-03-12 10:15:00 459

原创 LLM学习之路-01-第一章-预训练/搞懂大模型的分词器(五)

搞懂大模型的分词器(五)

2025-03-11 20:33:35 377

原创 LLM学习之路-01-第一章-预训练/搞懂大模型的分词器(四)

搞懂大模型的分词器(四)

2025-03-11 10:15:00 769

原创 LLM学习之路-01-第一章-预训练/搞懂大模型的分词器(三)

搞懂大模型的分词器(三)

2025-03-11 10:00:00 313

原创 LLM学习之路-01-第一章-预训练/搞懂大模型的分词器(二)

搞懂大模型的分词器(二)

2025-03-10 10:15:00 465

原创 LLM-01-第一章-预训练/搞懂大模型的分词器(一)

搞懂大模型的分词器(一)

2025-03-10 10:00:00 1132

原创 LLM学习之路-01-第一章-预训练/大模型训练框架(五)Accelerate

大模型训练框架(五)Accelerate

2025-03-09 10:15:00 640

原创 LLM学习之路-01-第一章-预训练/大模型训练框架(四)Megatron-LM

大模型训练框架(四)Megatron-LM

2025-03-09 10:00:00 1375

原创 LLM学习之路-01-第一章-预训练/大模型训练框架(三)DeepSpeed

大模型训练框架(三)DeepSpeed

2025-03-08 10:15:00 570

原创 LLM学习之路-01-第一章-预训练/大模型训练框架(二)FSDP

大模型训练框架(二)FSDP

2025-03-08 10:00:00 606

原创 LLM学习之路-01-第一章-预训练/大模型训练框架(一)综述

大模型训练框架

2025-03-07 10:15:00 1015

原创 LLM学习之路-01-第一章-预训练/大模型并行策略[中文翻译]

大模型并行策略[

2025-03-07 10:00:00 1609

原创 LLM学习之路-01-第一章-预训练/大模型分布式训练并行技术(二)数据并行

大模型分布式训练并行技术

2025-03-06 10:00:00 611

原创 LLM学习之路-01-第一章-预训练/大模型分布式训练并行技术(三)流水线并行

大模型分布式训练并行技术

2025-03-06 10:00:00 696

原创 LLM学习之路-01-第一章-预训练/大模型分布式训练并行技术(四)张量并行

大模型分布式训练并行技术(四)张量并行

2025-03-06 10:00:00 495

原创 LLM学习之路-01-第一章-预训练/大模型分布式训练并行技术(五)混合并行

大模型分布式训练并行技术(五)混合并行

2025-03-06 10:00:00 260

原创 LLM学习路线-01-第一章-预训练/复变函数在大模型位置编码中的应用

复变函数在大模型位置编码中的应用

2025-03-05 20:53:13 729

原创 LLM学习之路-01-第一章-预训练/大模型分布式训练并行技术(一)概述

大模型分布式训练并行技术

2025-03-05 20:51:53 426

原创 LLM学习之路-01-第一章-预训练/全网最全的大模型分词器(Tokenizer)总结

全网最全的大模型分词器(Tokenizer)总结

2025-03-05 10:15:00 779

原创 LLM学习之路-01-第一章-预训练/从欧拉公式的美到旋转位置编码RoPE

从欧拉公式的美到旋转位置编码RoPE

2025-03-05 10:00:00 814

原创 LLM学习之路-01-第一章-预训练/为什么大型语言模型都在使用SwiGLU作为激活函数?

为什么大型语言模型都在使用SwiGLU作为激活函数?

2025-03-04 10:00:00 756

原创 LLM学习之路-第一章-预训练/什么是大模型的位置编码Position-Encoding

什么是大模型的位置编码Position-Encoding

2025-03-04 10:00:00 1226

原创 LLM学习之路-01-第一章-预训练/为什么会发展出Multi-Query-Attention和Group-Query-Attention

为什么会发展出Multi-Query-Attention和Group-Query-Attention

2025-03-03 19:54:00 219

原创 LLM学习之路-01-第一章-预训练/一文了解Deepseek系列中的MLA技术

一文了解Deepseek系列中的MLA技术

2025-03-03 15:37:30 1231

AndroidStudio垃圾分类app

内含全部代码和apk,,可直接下载使用

2025-03-04

图像识别,信用卡数字识别,含代码和示例图片,可直接运行

图像识别,信用卡数字识别,含代码和示例图片,可直接运行

2025-03-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除