transformers模型加载与seed随机状态

最新推荐文章于 2025-01-23 17:22:33 发布

ziuno

最新推荐文章于 2025-01-23 17:22:33 发布

阅读量1.3k

点赞数

分类专栏：笔记 NLP 文章标签：深度学习 python pytorch

本文链接：https://blog.youkuaiyun.com/ziuno/article/details/126918257

版权

笔记同时被 2 个专栏收录

34 篇文章

订阅专栏

NLP

14 篇文章

订阅专栏

Transformers的模型加载会改变seed的随机状态

这里使用了一个自己写的库进行测试：py-seeds（直接pip就可以安装，目前是0.0.2版本）

import py_seeds
from transformers import AutoModel


def state_str(state_dict):
    random_state = str(state_dict["random"])
    numpy_state = str(state_dict["numpy"][0]) + str(state_dict["numpy"][1].tolist())
    torch_state = str(state_dict["torch"].numpy().tolist())
    torch_cuda_state = "".join([str(i.numpy().tolist()) for i in state_dict["torch_cuda"]])
    return random_state + numpy_state + torch_state + torch_cuda_state


# not load model
state = py_seeds.get_seed_state()
now_state = py_seeds.get_seed_state()
print(state_str(state) == state_str(now_state))
# True: no change to the random state

# load model
model = AutoModel.from_pretrained('roberta-base')
now_state = py_seeds.get_seed_state()
print(state_str(state) == state_str(now_state))
# False: the loading of transformers model would change the random state

# set state after loading
py_seeds.set_seed_state(state)
now_state = py_seeds.get_seed_state()
print(state_str(state) == state_str(now_state))
# True: must set state after loading to keep the random state same