- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 DeepSpeed功能模式
DeepSpeed是微软推出的一个开源深度学习优化库,主要目的是帮助我们在优先的硬件资源下训练超大规模的神经网络模型。简单来说,它就是一个“加速器”和“内存优化器”,能让你训练包括数十亿甚至数百亿的大模型变得更加可行和高效。ZeRo模式 让每个GPU只负责一部分数据,降低内存压力混合精度训练 在保证精度的同时节省资源流水线与模型并行 分工合作,加速大模型的计算推理优化与内存卸载 则确保了训练后模型的高效应用和资源高效利用。
2025-03-21 14:05:51
721
原创 linux系统中替换JAR包中文件
如果已经有一个新版本的目标文件,也可以直接将其替换到解压出来的路径下,执行命令cp application-dev.yml BOOT-INF/classes/application-dev.yml,新文件将会覆盖旧文件。执行命令jar tvf xxx.jar | grep application-dev.yml,执行后就可以看到目标文件在 JAR 包中的具体路径。执行命令jar uvf xxx.jar BOOT-INF,执行该命令后,目标文件将被替换到原 JAR 包中。STEP-3: 修改或替换目标文件。
2025-03-19 14:00:40
345
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人