自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

梦想破三的奔三狗

coding is ruling

原创【速写】解码策略的细节探讨

解码大法好

2025-03-24 10:10:47 275

原创【速写】R1: 从策略梯度到GRPO一些看法

GRPO work or not ?

2025-03-23 19:54:03 663

原创【学习笔记】LLM推理与部署

LLM inference and deployment

2025-03-22 11:35:30 941

原创【速写】如何在单卡A800（显存80G）上加载DeepSeek-Qwen-distill-32B（占用82G）？

炼金术

2025-03-20 09:22:40 775

原创【学习笔记】LLM+RL

强化学习进阶

2025-02-24 23:09:01 1090

原创【速写】解码与kv-cache的简单细节

黑练

2025-02-22 21:07:16 435

原创【学习笔记】蒙特卡洛与强化学习

视频链接：https://www.bilibili.com/video/BV1SV4y1i7bW文章目录[蒙特卡洛方法] 02 重要性采样（importance sampling）及 python 实现Basics实现重要性采样[蒙特卡洛方法] 03 接受/拒绝采样（accept/reject samping）初步 cases 分析BasicsExamples采样效率[蒙特卡洛方法] 04 重要性采样补充，数学性质及 On-policy vs. Off-policyp(x)p(x)p(x) v.s. q(

2024-12-23 23:02:19 547

原创【更新】LLM Interview

LLM interview

2024-12-23 23:01:05 879

原创【趣题分享】赤壁之战每日演兵（原诸葛亮列传兵法题）求解算法

小摸两下（补充了思路解析与可视化）

2024-12-05 23:28:38 578

原创【完结】cyのMemo（20241118~20241231）

黎明之前

2024-11-19 00:13:00 1269

原创【学习笔记】Langchain基础

Langchain杂记

2024-11-18 23:57:06 1136

原创【学习笔记】科学计算

然后我们换一种方式，使用num_workers为CPU核的一半，并使用pin_memory。另一个是JIT（Just-In-Time compilation) ）减少分页内存和pin memory的swap。

2024-11-18 23:56:47 1097

原创【学习笔记】pytorch分布式

这么一来，我们可以清楚地看到，Megatron-3中，一共有4个Allgather和4个reduce-scatter算子。乍一看，通信的操作比Megatron-1 2都多得多，但其实不然。因为一般而言，一个Allreduce其实就相当于1个Reduce-scatter和1个Allgather，所以他们的总通信量是一样的。关于all reduce可参考https://zhuanlan.zhihu.com/p/469942194，本质上是一个优化节点数据通信的算法，实现是比较容易的，阿里巴巴的ACCL。

2024-11-18 23:56:28 1045

原创【学习笔记】大模型调优（llms_tuning）

项目地址：GitHub@chunhuizhang/llms_tuning文章目录01 TRL SFTTrainer 中的 formatting_func 与 DataCollatorForCompletion02 accelerate ddp 与 trl SFTTrainer03 finetune_llama3_for_RAG04 optimizer Trainer 优化细节（AdamW，grad clip、Grad Norm）等05 StackLlama、SFT+DPO（代码组织、数据处理，pipel

2024-11-18 23:56:01 973

原创【学习笔记】量化概述

所谓那些int4模型，就是每个权重都由16个离散值表示，int8就是64个，以此类推，这个主意之前bf16, float32, float16的具体表征，三者都有1bit用来存符号，bf16跟float32的区别在于小数位减少，float16则两者都变少，分别是1+8+7，1+8+23，1+5+10，比如同样一个0.1234，三者的结果就是0.1235351…，0.1234000…，而75505则对应75505，inf，75264，即bf16是做了一个权衡，能表示很大的数，但是精度不够。

2024-11-18 23:55:27 749

原创【完结】cyのLastDance - Chapter2（20241030~20241117）

凤舞

2024-10-30 23:46:31 1276

原创【完结】cyのLastDance - Extra1（20241028~20241029）

番外篇

2024-10-28 22:43:28 1057

原创【完结】cyのLastDance - Chapter1（20240922~20241027）

轮舞

2024-09-22 20:06:36 1202

原创【完结】cy@Lugano（20240916~20240921）

天堂太远

2024-09-18 03:17:23 962

原创【完结】cyのMemo（20240820~20240915）

象牙塔之终章前奏曲

2024-08-20 23:42:59 1049

原创【完结】cyのMemo（20240722~20240819）

白夜

2024-07-22 23:10:48 1262

原创【完结】cyのMemo（20240609~20240721）

无缘

2024-06-11 21:28:27 1369 1

原创【完结】cyのMemo（20240422~20240608）

太阳，终将再度升起。

2024-04-22 20:47:06 1587

原创【完结】cyの破三之旅（下篇）（20240401~20240421）

残阳之空茫的终章

2024-04-01 22:03:50 1188 1

原创【完结】cyの破三之旅（上篇）（20240313~20240331）

前路无畏，我必将破三。

2024-03-12 11:28:08 846 1

原创【完结】cyのMemo（20240209~20240312）

沉沦与疯狂的序章

2024-02-09 22:49:58 1583 1

原创【完结】cyのMemo（20231231~20240208）

凛冬终逝，新年仍有太阳升起。

2023-12-31 21:35:26 4441

原创【完结】囚生CYのMemo（20231118~20231230）

All in, or nothing

2023-11-18 21:24:48 2059 3

原创【日常】爬虫技巧进阶：textarea的value修改与提交问题（以智谱清言为例）

Everything's okay, and so are you, sxy

2023-11-17 23:22:07 1707 1

原创【完结】囚生CYの备忘录（20231014~20231117）

我做到了

2023-10-14 22:30:46 1580 1

原创【完结】囚生CYの备忘录（20230822~20231012）

阳の言

2023-08-22 23:48:29 10611 2

原创【完结】囚生CYの备忘录（20230628~20230817）

夏练三伏

2023-06-28 22:50:57 10689

原创【日常】我的扬马最后一小时

筑梦之旅

2023-04-16 21:48:39 10470 1

原创【完结】囚生CYの备忘录（20230216~20230625）

魂归故里

2023-02-20 21:06:02 11454 1

原创【日常】矩阵正态分布参数检验问题

wk牛逼！！

2023-02-16 20:42:44 11040 1

原创【完结】囚生CYの备忘录（20221121-20230123）

梦觉

2022-11-22 11:14:51 12276 1

原创【完结】囚生CYの备忘录（20220906-20221120）

观月

2022-09-06 18:18:48 11709 1

原创【趣题分享】关于蒋干盗书你所需要知道的

失之我命

2022-07-11 00:12:05 11137 1

原创【论文阅读】2022年最新迁移学习综述笔注（Transferability in Deep Learning: A Survey）

愚公移山

2022-07-03 01:02:45 17018 6

原创【坑】金山文档批量下载技巧记录（Python+JS）

有思必有得

2022-06-27 19:53:19 16805 7

【日常】手写三层反向传播神经网络（损失函数交叉熵+正则项+反向求导）附件

用于博客代码的说明附件，内附数据集，任务pdf，任务解答代码，jupyter运行结果ipynb的代码报告，以及一份raw_code（代码中有缺块需要补充，用于练手）

2019-04-28

2018年全国大学生数学建模大赛B题

主要用于我的原创博客的资源链接，所以只上传了B题的原题。我是想设置为免积分下载，但是好像最少也要有1分，所以大家如果实在想要，可以在我对应博客下留邮箱，我会把全套赛题发送到各位朋友的邮箱里！

2018-10-09

Supply Chain Management_Strategy, Planning and Operations_5th Edition 高清英文版

本教材适用于大学本科管理学专业的学生及教师对供应链及运营管理方向进行学习，教授与发展。本教材高清可编辑。

2018-09-25

Supply Chain Management_Strategy, Planning and Operations_5th Edition 英文版

本PDF适用于运营管理以及供应链方向学生教师使用，共计529页英文版。虽然是影印但是清晰度非常好，欢迎各位同学下载学习！

2018-09-13

Introduction to probability models_Sheldon M.Ross.pdf 第11版英文版

本教材适用于大学本科教学学生及教师使用。适用与管理学，经济学以及理工科学生向运营管理，决策制定与机器学习方向发展使用的随机过程教材！

2018-09-13

Python gensim 4.x.x 中的BM25模型如何导入？

2021-10-20

Python3.7 DeprecationWarning: the formatter module is deprecated

2021-09-14

pyspark进行表连接时，左连接后无法display，但是同样逻辑改写成右连接后可以成功display，这种情况是怎么回事？

2020-06-29

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

囚生CY 优快云认证博客专家优快云认证企业博客

码龄8年

IP 属地：江苏省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

159: 原创

1万+: 周排名

2791: 总排名

219万+: 访问

: 等级

1万+: 积分

838: 粉丝

1511: 获赞

504: 评论

3574: 收藏

私信

关注

热门文章

分类专栏

最新评论

【项目小结】爬虫学习进阶：获取百度指数历史数据
_木_易_: 大佬这种解决办法吗 raise ValueError("API 返回的 'data' 字段是字符串，而不是字典: {}".format(json_response["data"])) ValueError: API 返回的 'data' 字段是字符串，而不是字典: {'status': 10018, 'data': '', 'logid': 3552200618, 'message': '您好，百度指数监测到您疑似存在异常访问行为，如您未有类似行为，可能是由于您使用公共网络或访问频次过高，\n 您可以通过邮箱ext_indexfk@baidu.com联系我们'}
【完结】cyのMemo（20240209~20240312）
Anna368: 你的daily好有趣哈哈哈哈
【论文阅读】2022年最新迁移学习综述笔注（Transferability in Deep Learning: A Survey）
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文阅读】2022年最新迁移学习综述笔注（Transferability in Deep Learning: A Survey）
囚生CY: 已修正[抱拳]
【论文阅读】2022年最新迁移学习综述笔注（Transferability in Deep Learning: A Survey）
麻豆527: 4.3.2和4.3.3的两个表放反啦

最新文章

提示

确定要删除当前文章？

取消删除