自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

梦想破三的奔三狗

coding is ruling

  • 博客(195)
  • 资源 (7)
  • 问答 (3)
  • 收藏
  • 关注

原创 【学习笔记】LLM Interview(Post Training 相关)

Boosting

2025-11-24 23:09:00 960

原创 【备忘】matplotlib绘制多系列柱状图 + 多坐标轴 + 3D绘图(水个勋章)

1024

2025-10-23 18:27:28 10112

原创 【慢摹】compute_metrics 与 evaluate 工具包常见问题详解

烂完了

2025-10-20 12:39:23 10054

原创 【速写】优化的深度与广度(Adam & Moun)

方位与步长

2025-10-18 18:36:55 10134

原创 【速写】困惑度与CAUSAL_LM生成loss的具体计算公式及验证

Aha moment

2025-09-24 22:26:48 10084

原创 【速写】transformers.TrainerCallBack详解

Callback

2025-09-23 15:10:22 10140

原创 【慢摹】单机多卡模型并行(ModelParallel,非数据并行)手动重写方案示例

天鹰

2025-09-20 14:42:48 10076

原创 【学习笔记】LLM Interview(Agent相关)

狗P Agent

2025-08-31 20:56:55 10100

原创 【学习笔记】强化学习的数学原理

DeepRL

2025-06-30 13:46:41 10188

原创 【速写】policy与reward分词器冲突问题(附XAI阅读推荐)

黄金屋

2025-06-15 23:32:41 10058

原创 【学习笔记】Langchain基础(二)

分而治之

2025-06-14 22:28:49 10153

原创 【慢摹】TRL训练器细节详解(SFT/PPO/DPO/GRPO)

授人以渔

2025-06-14 14:30:18 10533

原创 【端午安康】龙舟争渡Plug-In

整个烂活

2025-06-02 17:54:42 10043

原创 【速写】PPOTrainer样例与错误思考(少量DAPO)

峰回路转

2025-05-30 21:06:35 10255 5

原创 【速写】TRL:Trainer的细节与思考(PPO/DPO+LoRA可行性)

似是而非

2025-05-13 23:56:44 10291

原创 【速写】use_cache参数与decode再探讨

约束与收束

2025-05-12 23:21:07 10053

原创 【速写】prune与activate

杀与伐

2025-05-01 20:28:26 10082

原创 【更新】LLM Interview (2)

chap2

2025-04-28 22:29:28 10062

原创 【学习笔记】RL4LLM(三)

chap3

2025-04-28 22:25:24 10072

原创 【速写】conda安装(linux)

conda安装记录

2025-04-27 21:09:22 10209

原创 【速写】钩子与计算图

钩子文学二谈

2025-04-25 19:44:47 10035

原创 【速写】hook与fx

钩子文学

2025-04-23 23:33:03 10050

原创 【速写】多LoRA并行衍生的一些思考

孩子这并不好笑

2025-04-22 20:52:29 10054

原创 【速写】formatting_func与target_modules的细节(peft)

略显僵硬

2025-04-12 12:05:12 10181

原创 【学习笔记】RL4LLM(二)

chap2

2025-04-08 22:06:52 10120

原创 【清明折柳】写在扬马三周目后

冥想

2025-04-06 22:00:16 10030

原创 【速写】奖励建模中损失的一些性质

理解损失

2025-04-05 15:57:36 10034

原创 【学习笔记】Transformers源码分析

纳什说得对

2025-04-05 15:54:00 10053

原创 【速写】Transformer-encoder-decoder深度解析

温故而知新

2025-04-05 15:53:37 10078

原创 【学习笔记】深度学习环境部署相关

装机系列。

2025-04-05 15:53:07 10161

原创 【速写】SFT案例实操(以Qwen2.5-instruct-0.5B)

How to Lora?

2025-04-05 15:52:49 10166

原创 【速写】einops杂记

无用的常识

2025-04-05 15:51:50 10036

原创 【学习笔记】pytorch强化学习

mcts基础

2025-04-05 15:50:19 10097

原创 【速写】解码策略的细节探讨

解码大法好

2025-03-24 10:10:47 10088

原创 【速写】R1: 从策略梯度到GRPO一些看法

GRPO work or not ?

2025-03-23 19:54:03 10102

原创 【学习笔记】LLM推理与部署

LLM inference and deployment

2025-03-22 11:35:30 10074

原创 【速写】如何在单卡A800(显存80G)上加载DeepSeek-Qwen-distill-32B(占用82G)?

炼金术

2025-03-20 09:22:40 10194

原创 【学习笔记】RL4LLM(一)

chap1

2025-02-24 23:09:01 10091

原创 【速写】解码与kv-cache的简单细节

温故知新

2025-02-22 21:07:16 10039

原创 【学习笔记】蒙特卡洛与强化学习

MonteCarlo & Markov Chain = 2MC

2024-12-23 23:02:19 10061

【日常】手写三层反向传播神经网络(损失函数交叉熵+正则项+反向求导)附件

用于博客代码的说明附件,内附数据集,任务pdf,任务解答代码,jupyter运行结果ipynb的代码报告,以及一份raw_code(代码中有缺块需要补充,用于练手)

2019-04-28

2018年全国大学生数学建模大赛B题

主要用于我的原创博客的资源链接,所以只上传了B题的原题。我是想设置为免积分下载,但是好像最少也要有1分,所以大家如果实在想要,可以在我对应博客下留邮箱,我会把全套赛题发送到各位朋友的邮箱里!

2018-10-09

Introduction to probability models_Sheldon M.Ross.pdf 第11版英文版

本教材适用于大学本科教学学生及教师使用。适用与管理学,经济学以及理工科学生向运营管理,决策制定与机器学习方向发展使用的随机过程教材!

2018-09-13

Supply Chain Management_Strategy, Planning and Operations_5th Edition 英文版

本PDF适用于运营管理以及供应链方向学生教师使用,共计529页英文版。虽然是影印但是清晰度非常好,欢迎各位同学下载学习!

2018-09-13

Supply Chain Management_Strategy, Planning and Operations_5th Edition 高清英文版

本教材适用于大学本科管理学专业的学生及教师对供应链及运营管理方向进行学习,教授与发展。本教材高清可编辑。

2018-09-25

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除