自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 收藏
  • 关注

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(二)SGD

神经网络的优化器(二)SGD

2025-03-15 10:00:00 2305

原创 LLM学习之路-01-第一章-预训练/神经网络的优化器(一)概述

神经网络的优化器(一)概述

2025-03-14 20:08:32 882

原创 LLM学习之路-01-第一章-预训练/看懂FlashAttention需要的数学储备是?高考数学最后一道大题!

看懂FlashAttention需要的数学储备是?高考数学最后一道大题!

2025-03-14 20:00:35 871

原创 LLM学习之路-01-第一章-预训练/混合专家模型MoE详解节选

混合专家模型MoE详解节选

2025-03-13 10:15:00 1074

原创 LLM学习之路-01-第一章-预训练/最美的数学公式-欧拉公式

最美的数学公式-欧拉公式

2025-03-13 10:00:00 1087

原创 LLM学习之路-01-第一章-预训练/搞懂大模型的分词器(六)

搞懂大模型的分词器(六)

2025-03-12 10:15:00 507

原创 LLM学习之路-01-第一章-预训练/搞懂大模型的分词器(五)

搞懂大模型的分词器(五)

2025-03-11 20:33:35 397

原创 LLM学习之路-01-第一章-预训练/搞懂大模型的分词器(四)

搞懂大模型的分词器(四)

2025-03-11 10:15:00 796

原创 LLM学习之路-01-第一章-预训练/搞懂大模型的分词器(三)

搞懂大模型的分词器(三)

2025-03-11 10:00:00 340

原创 LLM学习之路-01-第一章-预训练/搞懂大模型的分词器(二)

搞懂大模型的分词器(二)

2025-03-10 10:15:00 501

原创 LLM-01-第一章-预训练/搞懂大模型的分词器(一)

搞懂大模型的分词器(一)

2025-03-10 10:00:00 1163

原创 LLM学习之路-01-第一章-预训练/大模型训练框架(五)Accelerate

大模型训练框架(五)Accelerate

2025-03-09 10:15:00 695

原创 LLM学习之路-01-第一章-预训练/大模型训练框架(四)Megatron-LM

大模型训练框架(四)Megatron-LM

2025-03-09 10:00:00 1460

原创 LLM学习之路-01-第一章-预训练/大模型训练框架(三)DeepSpeed

大模型训练框架(三)DeepSpeed

2025-03-08 10:15:00 665

原创 LLM学习之路-01-第一章-预训练/大模型训练框架(二)FSDP

大模型训练框架(二)FSDP

2025-03-08 10:00:00 805

原创 LLM学习之路-01-第一章-预训练/大模型训练框架(一)综述

大模型训练框架

2025-03-07 10:15:00 1075

原创 LLM学习之路-01-第一章-预训练/大模型并行策略[中文翻译]

大模型并行策略[

2025-03-07 10:00:00 2643

原创 LLM学习之路-01-第一章-预训练/大模型分布式训练并行技术(二)数据并行

大模型分布式训练并行技术

2025-03-06 10:00:00 650

原创 LLM学习之路-01-第一章-预训练/大模型分布式训练并行技术(三)流水线并行

大模型分布式训练并行技术

2025-03-06 10:00:00 717

原创 LLM学习之路-01-第一章-预训练/大模型分布式训练并行技术(四)张量并行

大模型分布式训练并行技术(四)张量并行

2025-03-06 10:00:00 529

原创 LLM学习之路-01-第一章-预训练/大模型分布式训练并行技术(五)混合并行

大模型分布式训练并行技术(五)混合并行

2025-03-06 10:00:00 288

原创 LLM学习路线-01-第一章-预训练/复变函数在大模型位置编码中的应用

复变函数在大模型位置编码中的应用

2025-03-05 20:53:13 752

原创 LLM学习之路-01-第一章-预训练/大模型分布式训练并行技术(一)概述

大模型分布式训练并行技术

2025-03-05 20:51:53 455

原创 LLM学习之路-01-第一章-预训练/全网最全的大模型分词器(Tokenizer)总结

全网最全的大模型分词器(Tokenizer)总结

2025-03-05 10:15:00 864

原创 LLM学习之路-01-第一章-预训练/从欧拉公式的美到旋转位置编码RoPE

从欧拉公式的美到旋转位置编码RoPE

2025-03-05 10:00:00 842

原创 LLM学习之路-01-第一章-预训练/为什么大型语言模型都在使用SwiGLU作为激活函数?

为什么大型语言模型都在使用SwiGLU作为激活函数?

2025-03-04 10:00:00 838

原创 LLM学习之路-第一章-预训练/什么是大模型的位置编码Position-Encoding

什么是大模型的位置编码Position-Encoding

2025-03-04 10:00:00 1360

原创 LLM学习之路-01-第一章-预训练/为什么会发展出Multi-Query-Attention和Group-Query-Attention

为什么会发展出Multi-Query-Attention和Group-Query-Attention

2025-03-03 19:54:00 240

原创 LLM学习之路-01-第一章-预训练/一文了解Deepseek系列中的MLA技术

一文了解Deepseek系列中的MLA技术

2025-03-03 15:37:30 1299

原创 LLM学习之路-01-第一章-预训练/FlashAttentionv2相比于v1有哪些更新?

FlashAttentionv2相比于v1有哪些更新?

2025-03-03 15:13:54 1094

原创 LLM学习之路-01-第一章-预训练/10分钟搞清楚为什么Transformer中使用LayerNorm而不是BatchNorm

LLM学习路线

2025-03-02 21:26:08 1004

原创 LLM学习之路-01-第一章-预训练/10分钟了解什么是多模态大模型

LLM学习路线

2025-03-01 22:15:39 514

原创 LLM学习路线-00-序-AGI之路/智能涌现和AGI的起源

LLM学习路线

2025-02-28 20:09:36 1210 2

原创 LLM学习路线-00-序-AGI之路/大家都在谈的ScalingLaw是什么

LLM的学习之路

2025-02-28 19:49:57 651

原创 深度优先搜索(DFS)和广度优先搜索(BFS)两种算法c++

本文介绍了BFS和DFS两种算法及其实现过程,以及通过这两种算法解决迷宫复杂问题和七段码问题的解题思路以及完整代码展示!

2022-12-12 01:04:41 13833 5

图像识别,信用卡数字识别,含代码和示例图片,可直接运行

图像识别,信用卡数字识别,含代码和示例图片,可直接运行

2025-03-04

AndroidStudio垃圾分类app

内含全部代码和apk,,可直接下载使用

2025-03-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除