transform下载模型

irrationality

于 2023-03-04 19:23:11 发布

阅读量492

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签： transformer

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_54227557/article/details/129336867

机器学习专栏收录该内容

113 篇文章

订阅专栏

代码示例展示了如何加载两个不同版本的GPT-2模型到PyTorch设备上，并设置为评估模式。在运行过程中，模型的配置文件和权重被下载，这些文件通常用于训练后的推理任务。此外，讨论了模型的保存和缓存机制。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

运行代码： model1 = GPT2LMHeadModel.from_pretrained(‘gpt2-xl’, return_dict=True).to(device) model1.config.pad_token_id = model1.config.eos_token_id model2 = GPT2LMHeadModel.from_pretrained(‘gpt2’, return_dict=True).to(device) model1.eval() model2.eval() 显示一串内容 n:0 total:689 elapsed:0.03336215019226074 ncols:null nrows:null prefix:“Downloading (…)lve/main/config.json” ascii:false unit:“B” unit_scale:true rate:null bar_format:null postfix:null unit_divisor:1000 initial:0 colour:null Filter… n:0 total:6431878936 elapsed:0.033989667892456055 ncols:null nrows:null prefix:“Downloading (…)“pytorch_model.bin”;” ascii:false unit:“B” unit_scale:true rate:null bar_format:null postfix:null unit_divisor:1000 initial:0 colour:null 是什么意思？
在这里插入图片描述

代码是用来加载两个预训练的 GPT-2 模型，并将它们设置为评估模式。GPT-2 是一个自回归语言模型，可以生成文本¹²³。

显示一串内容是你的代码运行时的输出，它显示了你正在下载两个模型的配置文件和权重文件，以及下载进度和速度⁴⁵。

这些模型会被下载到你的缓存目录中，你可以通过设置 TORCH_HOME 环境变量来指定这个目录³。你也可以用 torch.save() 函数来保存模型的状态字典，这样可以方便地恢复模型²。一般来说，PyTorch 的惯例是用 .pt 或 .pth 文件扩展名来保存模型²。

用find命令也可以查找
在这里插入图片描述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

irrationality 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。