自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 强化学习:高级策略梯度理论与优化方法

NPG、兼容函数逼近定理、TRPO、PPO、DPO

2025-04-26 17:10:26 561

原创 强化学习:基础理论与高级DQN算法及策略梯度基础

强化学习基础理论与高级DQN算法及策略梯度基础

2025-04-25 13:43:52 463

原创 基础数学:数值分析与离散数学

数值分析与离散数学

2025-04-12 14:11:40 1156

原创 基础数学:图论与信息论

图论与信息论

2025-04-12 13:31:16 1230

原创 基础数学:线性代数与优化理论

线代与优化

2025-04-11 14:01:24 2293

原创 基础数学:微积分和概率与统计

微积分与概率论

2025-04-11 10:32:51 1141

原创 从理论到实践:并行采样+顺序修订的联合优化

从数学理论到编程实践:并行采样+顺序修订的联合优化

2025-04-10 12:42:03 985

原创 从理论到实践:树形思维探索(ToT)

从数学理论到编程实践:带你学习树形思维探索(ToT)

2025-04-10 12:26:17 1104

原创 从理论到实践:CoT的多路径生成与自洽性

从数学理论到编程实践:CoT的多路径生成与自洽性验证

2025-04-09 08:37:06 1328

原创 从理论到实践:思维链(CoT)提示

在开始前请确保您有一定的LLM基础和强化学习基础😊如果您没有RL基础我推荐David Sliver的讲座(前三集即可)

2025-04-09 02:30:00 1818

原创 从理论到实践:数据统计方法中的投票策略

从数学理论到编程实践:数据统计方法中的投票策略

2025-04-08 12:49:32 831

原创 从理论到实践:使用Triton实现FlashAttention三个版本

从数学理论到编程实践:使用Triton实现FlashAttention的三个版本

2025-04-08 10:14:24 2930

原创 从理论到实践:absmax、zeropoint和LLM.int8()在gpt-2的应用

从数学理论到编程实践:分析三种量化方法

2025-04-07 17:59:29 976

原创 从理论到实践:Pytorch实现注意力机制到Triton优化

从数学理论到编程实践:Pytorch实现多头注意力到Triton优化

2025-04-07 00:02:24 1317

原创 从理论到实践:字节对编码(BPE)算法

从数学理论到代码实现学习BPE算法

2025-04-06 11:46:37 1280

原创 从理论到实践:带你快速学习基于PRM的三种搜索方法

三种搜索算法从数学视角到代码实现,并附有我的github仓库

2025-04-06 00:42:01 1339

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除