自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

梦想破三的奔三狗

coding is ruling

  • 博客(162)
  • 资源 (7)
  • 问答 (3)
  • 收藏
  • 关注

原创 【速写】解码策略的细节探讨

解码大法好

2025-03-24 10:10:47 275

原创 【速写】R1: 从策略梯度到GRPO一些看法

GRPO work or not ?

2025-03-23 19:54:03 663

原创 【学习笔记】LLM推理与部署

LLM inference and deployment

2025-03-22 11:35:30 941

原创 【速写】如何在单卡A800(显存80G)上加载DeepSeek-Qwen-distill-32B(占用82G)?

炼金术

2025-03-20 09:22:40 775

原创 【学习笔记】LLM+RL

强化学习进阶

2025-02-24 23:09:01 1090

原创 【速写】解码与kv-cache的简单细节

黑练

2025-02-22 21:07:16 435

原创 【学习笔记】蒙特卡洛与强化学习

视频链接:https://www.bilibili.com/video/BV1SV4y1i7bW文章目录[蒙特卡洛方法] 02 重要性采样(importance sampling)及 python 实现Basics实现重要性采样[蒙特卡洛方法] 03 接受/拒绝采样(accept/reject samping)初步 cases 分析BasicsExamples采样效率[蒙特卡洛方法] 04 重要性采样补充,数学性质及 On-policy vs. Off-policyp(x)p(x)p(x) v.s. q(

2024-12-23 23:02:19 547

原创 【更新】LLM Interview

LLM interview

2024-12-23 23:01:05 879

原创 【趣题分享】赤壁之战每日演兵(原诸葛亮列传兵法题)求解算法

小摸两下(补充了思路解析与可视化)

2024-12-05 23:28:38 578

原创 【完结】cyのMemo(20241118~20241231)

黎明之前

2024-11-19 00:13:00 1269

原创 【学习笔记】Langchain基础

Langchain杂记

2024-11-18 23:57:06 1136

原创 【学习笔记】科学计算

然后我们换一种方式,使用num_workers为CPU核的一半,并使用pin_memory。另一个是JIT(Just-In-Time compilation) )减少分页内存和pin memory的swap。

2024-11-18 23:56:47 1097

原创 【学习笔记】pytorch分布式

这么一来,我们可以清楚地看到,Megatron-3中,一共有4个Allgather和4个reduce-scatter算子。乍一看,通信的操作比Megatron-1 2都多得多,但其实不然。因为一般而言,一个Allreduce其实就相当于1个Reduce-scatter和1个Allgather,所以他们的总通信量是一样的。关于all reduce可参考https://zhuanlan.zhihu.com/p/469942194,本质上是一个优化节点数据通信的算法,实现是比较容易的,阿里巴巴的ACCL。

2024-11-18 23:56:28 1045

原创 【学习笔记】大模型调优(llms_tuning)

项目地址:GitHub@chunhuizhang/llms_tuning文章目录01 TRL SFTTrainer 中的 formatting_func 与 DataCollatorForCompletion02 accelerate ddp 与 trl SFTTrainer03 finetune_llama3_for_RAG04 optimizer Trainer 优化细节(AdamW,grad clip、Grad Norm)等05 StackLlama、SFT+DPO(代码组织、数据处理,pipel

2024-11-18 23:56:01 973

原创 【学习笔记】量化概述

所谓那些int4模型,就是每个权重都由16个离散值表示,int8就是64个,以此类推,这个主意之前bf16, float32, float16的具体表征,三者都有1bit用来存符号,bf16跟float32的区别在于小数位减少,float16则两者都变少,分别是1+8+7,1+8+23,1+5+10,比如同样一个0.1234,三者的结果就是0.1235351…,0.1234000…,而75505则对应75505,inf,75264,即bf16是做了一个权衡,能表示很大的数,但是精度不够。

2024-11-18 23:55:27 749

原创 【完结】cyのLastDance - Chapter2(20241030~20241117)

凤舞

2024-10-30 23:46:31 1276

原创 【完结】cyのLastDance - Extra1(20241028~20241029)

番外篇

2024-10-28 22:43:28 1057

原创 【完结】cyのLastDance - Chapter1(20240922~20241027)

轮舞

2024-09-22 20:06:36 1202

原创 【完结】cy@Lugano(20240916~20240921)

天堂太远

2024-09-18 03:17:23 962

原创 【完结】cyのMemo(20240820~20240915)

象牙塔之终章前奏曲

2024-08-20 23:42:59 1049

原创 【完结】cyのMemo(20240722~20240819)

白夜

2024-07-22 23:10:48 1262

原创 【完结】cyのMemo(20240609~20240721)

无缘

2024-06-11 21:28:27 1369 1

原创 【完结】cyのMemo(20240422~20240608)

太阳,终将再度升起。

2024-04-22 20:47:06 1587

原创 【完结】cyの破三之旅(下篇)(20240401~20240421)

残阳之空茫的终章

2024-04-01 22:03:50 1188 1

原创 【完结】cyの破三之旅(上篇)(20240313~20240331)

前路无畏,我必将破三。

2024-03-12 11:28:08 846 1

原创 【完结】cyのMemo(20240209~20240312)

沉沦与疯狂的序章

2024-02-09 22:49:58 1583 1

原创 【完结】cyのMemo(20231231~20240208)

凛冬终逝,新年仍有太阳升起。

2023-12-31 21:35:26 4441

原创 【完结】囚生CYのMemo(20231118~20231230)

All in, or nothing

2023-11-18 21:24:48 2059 3

原创 【日常】爬虫技巧进阶:textarea的value修改与提交问题(以智谱清言为例)

Everything's okay, and so are you, sxy

2023-11-17 23:22:07 1707 1

原创 【完结】囚生CYの备忘录(20231014~20231117)

我做到了

2023-10-14 22:30:46 1580 1

原创 【完结】囚生CYの备忘录(20230822~20231012)

阳の言

2023-08-22 23:48:29 10611 2

原创 【完结】囚生CYの备忘录(20230628~20230817)

夏练三伏

2023-06-28 22:50:57 10689

原创 【日常】我的扬马最后一小时

筑梦之旅

2023-04-16 21:48:39 10470 1

原创 【完结】囚生CYの备忘录(20230216~20230625)

魂归故里

2023-02-20 21:06:02 11454 1

原创 【日常】矩阵正态分布参数检验问题

wk牛逼!!

2023-02-16 20:42:44 11040 1

原创 【完结】囚生CYの备忘录(20221121-20230123)

梦觉

2022-11-22 11:14:51 12276 1

原创 【完结】囚生CYの备忘录(20220906-20221120)

观月

2022-09-06 18:18:48 11709 1

原创 【趣题分享】关于蒋干盗书你所需要知道的

失之我命

2022-07-11 00:12:05 11137 1

原创 【论文阅读】2022年最新迁移学习综述笔注(Transferability in Deep Learning: A Survey)

愚公移山

2022-07-03 01:02:45 17018 6

原创 【坑】金山文档批量下载技巧记录(Python+JS)

有思必有得

2022-06-27 19:53:19 16805 7

【日常】手写三层反向传播神经网络(损失函数交叉熵+正则项+反向求导)附件

用于博客代码的说明附件,内附数据集,任务pdf,任务解答代码,jupyter运行结果ipynb的代码报告,以及一份raw_code(代码中有缺块需要补充,用于练手)

2019-04-28

2018年全国大学生数学建模大赛B题

主要用于我的原创博客的资源链接,所以只上传了B题的原题。我是想设置为免积分下载,但是好像最少也要有1分,所以大家如果实在想要,可以在我对应博客下留邮箱,我会把全套赛题发送到各位朋友的邮箱里!

2018-10-09

Supply Chain Management_Strategy, Planning and Operations_5th Edition 高清英文版

本教材适用于大学本科管理学专业的学生及教师对供应链及运营管理方向进行学习,教授与发展。本教材高清可编辑。

2018-09-25

Supply Chain Management_Strategy, Planning and Operations_5th Edition 英文版

本PDF适用于运营管理以及供应链方向学生教师使用,共计529页英文版。虽然是影印但是清晰度非常好,欢迎各位同学下载学习!

2018-09-13

Introduction to probability models_Sheldon M.Ross.pdf 第11版英文版

本教材适用于大学本科教学学生及教师使用。适用与管理学,经济学以及理工科学生向运营管理,决策制定与机器学习方向发展使用的随机过程教材!

2018-09-13

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除