速写
文章平均质量分 93
囚生CY
不如养生
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【速写】优化的深度与广度(Adam & Moun)
方位与步长原创 2025-10-18 18:36:55 · 10134 阅读 · 0 评论 -
【速写】困惑度与CAUSAL_LM生成loss的具体计算公式及验证
Aha moment原创 2025-09-24 22:26:48 · 10084 阅读 · 0 评论 -
【速写】transformers.TrainerCallBack详解
Callback原创 2025-09-23 15:10:22 · 10140 阅读 · 0 评论 -
【速写】policy与reward分词器冲突问题(附XAI阅读推荐)
黄金屋原创 2025-06-15 23:32:41 · 10058 阅读 · 0 评论 -
【速写】PPOTrainer样例与错误思考(少量DAPO)
峰回路转原创 2025-05-30 21:06:35 · 10255 阅读 · 4 评论 -
【速写】TRL:Trainer的细节与思考(PPO/DPO+LoRA可行性)
似是而非原创 2025-05-13 23:56:44 · 10291 阅读 · 0 评论 -
【速写】use_cache参数与decode再探讨
约束与收束原创 2025-05-12 23:21:07 · 10053 阅读 · 0 评论 -
【速写】prune与activate
杀与伐原创 2025-05-01 20:28:26 · 10082 阅读 · 0 评论 -
【速写】conda安装(linux)
conda安装记录原创 2025-04-27 21:09:22 · 10209 阅读 · 0 评论 -
【速写】钩子与计算图
钩子文学二谈原创 2025-04-25 19:44:47 · 10035 阅读 · 0 评论 -
【速写】hook与fx
钩子文学原创 2025-04-23 23:33:03 · 10050 阅读 · 0 评论 -
【速写】多LoRA并行衍生的一些思考
孩子这并不好笑原创 2025-04-22 20:52:29 · 10054 阅读 · 0 评论 -
【速写】formatting_func与target_modules的细节(peft)
略显僵硬原创 2025-04-12 12:05:12 · 10181 阅读 · 0 评论 -
【速写】奖励建模中损失的一些性质
理解损失原创 2025-04-05 15:57:36 · 10034 阅读 · 0 评论 -
【速写】Transformer-encoder-decoder深度解析
温故而知新原创 2025-04-05 15:53:37 · 10078 阅读 · 0 评论 -
【速写】SFT案例实操(以Qwen2.5-instruct-0.5B)
How to Lora?原创 2025-04-05 15:52:49 · 10166 阅读 · 0 评论 -
【速写】einops杂记
无用的常识原创 2025-04-05 15:51:50 · 10036 阅读 · 0 评论 -
【速写】解码策略的细节探讨
解码大法好原创 2025-03-24 10:10:47 · 10088 阅读 · 0 评论 -
【速写】R1: 从策略梯度到GRPO一些看法
GRPO work or not ?原创 2025-03-23 19:54:03 · 10102 阅读 · 0 评论 -
【速写】如何在单卡A800(显存80G)上加载DeepSeek-Qwen-distill-32B(占用82G)?
炼金术原创 2025-03-20 09:22:40 · 10194 阅读 · 0 评论 -
【速写】解码与kv-cache的简单细节
温故知新原创 2025-02-22 21:07:16 · 10039 阅读 · 0 评论
分享