自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (3)
  • 收藏
  • 关注

原创 数据集笔记

数据集是海量非结构化文本,简单说就是重视数量,不重视质量,主要目的就是学说话,这个场景几乎只存在几个头部基础模型训练会涉及,不做过多介绍。指令微调,数据集格式为 指令instruction,问题输入input,问题回答output。数据集要做好标注,要求对输入做什么操作后输出是什么,类似上述的数据集格式。对于需要做垂域微调数据集,金融法律医疗这些行业可能会用到。数据集格式如上,需要多轮上下文,角色身份等等信息。不同阶段,为了不同训练目的的数据集是不同的,数据集格式需包含COT思维链,也就是思考过程。

2025-05-09 16:15:05 398

原创 GPU通信技术

我们本次测试使用的是QWQ模型,我们通过打印模型结构可以看到由64个decoder组成,即64层,L=64,结合上述公式去除相同项,可以看到TP=8是TP=4&PP=2的4L倍,由于我们模型L=64,即两者流量理论上相差256倍(粗估)即将数据集分成多个子集,每个子集分配给不同的计算节点(GPU),每个节点上都有完整的模型副本,每个节点处理不同的数据子集,计算梯度后,通过集合通信(如AllReduce)同步梯度,更新模型参数。以我们TP=8时,通信量约为:(2*2*H*S*B+2*2*H*S*B)*L。

2025-05-08 17:07:22 1955

原创 HAMI与NVIDIA device plugin笔记

HAMi 可为多种异构设备提供虚拟化功能,支持设备共享和资源隔离,也是一个为K8S pod能调度GPU的中间件插件,能够实现 GPU 的细粒度的隔离,但他可以对 core 和 memory 使用 1% 级别的隔离。HAMI是挂载 libvgpu.so 替换 Pod 中的原生驱动,并添加CUDA_DEVICE_MEMORY_LIMIT_X 和 CUDA_DEVICE_SM_LIMIT环境变量。目前在K8S上调用过2种GPU插件,分别是NVIDIA device plugin和HAMI,

2025-04-25 17:45:03 789

UE21.30.1010破解工具

UE21.30.1010,真正的30版本破解,亲测可用!

2014-11-06

total command 8.51A 32&64破解

直接把里边的32 or 64位文件解压到目录下即可。

2014-11-06

secure7.25破解

secure7.25破解,32位64位均有!

2014-11-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除