自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 Deepspeed训练好的权重如何加载

我一开始是用model.load_state_dict()直接分别导入两个pt文件,发现出现大量missing key,但我检查了权重的key,奇怪的是我发现权重里是存在这些missing key的,但是这些key的值都为空。遇到一个很奇怪的现象,明明训练时的loss降的很低,但加载训练好的权重后实际测试效果却很差,检查了模型的输入输出都没问题。用get_fp32_state_dict_from_zero_checkpoint进行权重转化后就能正确导入权重啦!

2025-01-03 10:27:13 515

原创 服务器使用本机代理

本文介绍如何让远程服务器连接本机代理首先要确定本机与服务器连接在同一个网络下。

2024-12-12 21:46:50 393

原创 国内HuggingFace连接不上

huggingface-cli download --repo-type dataset --token 你的token --resume-download 数据集名称 --cache-dir /本地路径 --local-dir-use-symlinks False。3、如果依旧连接超时,去刷新HF的access token,注意权限要设置为write。# 这种方式,数据集会保存到"/本地路径"中。

2024-11-29 08:55:50 1173

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除