自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(155)
  • 收藏
  • 关注

原创 自定义数据集(pytorch&huggingface)

自定义数据集(pytorch&huggingface)

2025-08-15 22:37:04 613 1

原创 17、CryptoMamba论文笔记

CryptoMamba论文笔记

2025-08-12 20:52:57 715

原创 Mamba 原理汇总2

Mamba 原理汇总2

2025-08-11 16:31:30 1004

原创 Linux用户

Linux用户

2025-07-26 15:16:30 777

原创 Matplotlib和Plotly知识点(Dash+Plotly分页展示)

Matplotlib和Plotly知识点(Dash+Plotly分页展示)

2025-07-19 15:49:11 1177

原创 四六级英语作文模版

四六级英语作文模版

2025-06-14 12:28:36 1057

原创 Pytorch知识点2

Pytorch知识点

2025-06-02 17:24:46 1013

原创 Numpy知识点

Numpy知识点

2025-05-29 20:52:52 1183

原创 GPU层次结构(Nvidia和Apple M芯片,从硬件到pytorch)

GPU层次结构(Nvidia和Apple M芯片,从硬件到pytorch)

2025-05-29 17:23:18 1665

原创 Mac完美终端(iterm2 + oh my zash + tmux+ControlMaster)

Mac完美终端(iterm2 + oh my zash + tmux+ControlMaster)

2025-05-28 17:08:31 1379

原创 26、DAPO论文笔记(解耦剪辑与动态采样策略优化,GRPO的改进)

DAPO论文笔记(解耦剪辑与动态采样策略优化,GRPO的改进)

2025-05-19 11:13:30 1540 1

原创 deepseek系列论文汇总(时至2025.5)

deepseek系列论文汇总(时至2025.5)

2025-05-18 10:44:45 2622

原创 提示词工程框架:CoT、ToT、GoT、PoT( 链式提示)

提示词工程框架:CoT、ToT、GoT、PoT( 链式提示)

2025-05-17 20:20:29 1376

原创 25、DeepSeek-R1论文笔记

DeepSeek-R1论文笔记

2025-05-17 20:15:04 1105 1

原创 26、思维链Chain-of-Thought(CoT)论文笔记

思维链Chain-of-Thought(CoT)论文笔记

2025-05-17 20:05:11 1686 1

原创 多令牌预测Multi-Token Prediction(MTP)

多令牌预测Multi-Token Prediction(MTP)

2025-05-12 16:58:49 1340

原创 24、DeepSeek-V3论文笔记

DeepSeek-V3论文笔记

2025-05-12 16:57:49 1201 3

原创 RoPE(旋转位置编码,参考:DeepSeek-V2)

RoPE(旋转位置编码,参考:DeepSeek-V2)

2025-05-11 10:52:54 885

原创 Transformer KV缓存优化(MHA、MQA、GQA、MLA,参考:DeepSeek-V2)

Transformer KV缓存优化(MHA、MQA、GQA、MLA)

2025-05-11 10:38:34 883

原创 19、DeepSeek LLM论文笔记

DeepSeek LLM论文笔记

2025-05-11 10:36:07 1306 1

原创 23、DeepSeek-V2论文笔记

DeepSeek-V2论文笔记

2025-05-11 09:57:22 1318 1

原创 21、DeepSeekMath论文笔记(GRPO)

DeepSeekMath论文笔记(GRPO)

2025-05-10 21:57:23 1322 1

原创 强化学习--6.算法分类及优化原理

强化学习--6.算法分类及优化原理

2025-05-09 11:49:57 1139

原创 22、近端策略优化算法(PPO)论文笔记

近端策略优化算法(PPO)论文笔记

2025-05-08 21:58:40 1170 7

原创 强化学习--5.优化目标、价值函数、策略梯度

强化学习--5.优化目标、价值函数、策略梯度

2025-05-08 09:52:44 720

原创 强化学习--4.策略梯度方法(蒙特卡罗)

强化学习 策略梯度方法(蒙特卡罗)

2025-05-03 12:02:06 1158

原创 强化学习--3.值函数的方法(贝尔曼方程)

强化学习 值函数的方法(贝尔曼方程)

2025-05-03 12:01:03 944

原创 强化学习--2.数学

强化学习数学

2025-05-03 11:59:41 1036

原创 强化学习--1.汇总

强化学习汇总

2025-04-28 10:57:03 1330

原创 20、 DeepSeekMoE论文笔记

DeepSeekMoE论文笔记

2025-04-23 15:34:47 973 1

原创 18、TimeDiff论文笔记

TimeDiff论文

2025-04-19 17:57:38 995 1

原创 DDPM(diffusion)原理

DDPM(diffusion)原理

2025-04-19 17:45:49 1063

原创 Mamba 原理汇总

Mamba 原理

2025-04-16 20:51:29 1014

原创 MOE(Mixture-of-Experts)混合专家模型知识点汇总

MOE(Mixture-of-Experts)混合专家模型知识点汇总

2025-04-15 10:58:57 1640

原创 RNN、LSTM、GRU汇总

RNN、LSTM、GRU汇总

2025-04-08 12:09:29 1293

原创 模型压缩(量化、剪枝、蒸馏、低秩分解)

模型压缩(量化、剪枝、蒸馏、低秩分解)

2025-03-29 16:28:20 943

原创 python 多线程异常(主线程捕获子线程异常)

主线程捕获子线程异常

2025-03-24 11:03:30 662

原创 U盘鉴定(容量/速度)

U盘鉴定(容量/速度)

2025-02-08 11:08:05 972

原创 炒股/股票

炒股、股票

2025-02-05 15:11:08 3558

原创 炒股-消息面分析

炒股-消息面分析

2025-02-05 13:10:30 1409

备份4:DAPO参考原文备份

参考:https://zhuanlan.zhihu.com/p/696537369

2025-05-19

备份3:MTP参考原文备份

多令牌预测Multi-Token Prediction(MTP) 参考原文备份: https://zhuanlan.zhihu.com/p/18056041194 https://blog.youkuaiyun.com/weixin_43290383/article/details/146245802 https://zhuanlan.zhihu.com/p/24226643215 https://cloud.tencent.com/developer/article/2505000

2025-05-12

备份2:强化学习-PPO 算法

强化学习--PPO 算法 原文链接: https://datawhalechina.github.io/easy-rl/#/ https://datawhalechina.github.io/easy-rl/#/chapter5/chapter5?id=_51-%e9%87%8d%e8%a6%81%e6%80%a7%e9%87%87%e6%a0%b7

2025-05-07

备份1:强化学习-策略梯度推导备份

备份1:强化学习_策略梯度推导备份 原文地址:https://zhuanlan.zhihu.com/p/30614572553

2025-05-05

9、U盘鉴定工具(容量/速度)

U盘鉴定工具(容量/速度)

2025-02-08

8、数据库+C语言 PDF

8、数据库+C语言 PDF

2024-05-18

7、ftp配置文件及说明

ftp配置文件及说明

2024-05-01

Gemini调研(-)

Gemini调研(-)

2024-04-09

aigc应用场景收藏收藏文件

aigc应用场景收藏

2024-03-04

6、数二笔记(数学))

6、数二笔记(数学))

2023-12-26

5、英语二作文模版(作文)

5、英语二作文模版(作文)

2023-12-26

4、阅读的逻辑(阅读)

4、阅读的逻辑(阅读)

2023-12-26

3、Flask boostrap实现图片视频上传下载展示

Flask boostrap实现图片视频上传下载展示

2023-07-02

2、python答题卡及工作项目

opencv 答题卡

2023-01-05

1、opencv多线程接口

opencv多线程图像分割合并接口

2023-01-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除