huggingface使用与环境移植

MallocLu

已于 2023-12-16 21:09:12 修改

阅读量283

点赞数

CC 4.0 BY-SA版权

分类专栏： Deep Learning 文章标签： python pytorch

于 2023-12-16 16:46:31 首次发布

本文链接：https://blog.youkuaiyun.com/qq_42283621/article/details/135034726

Deep Learning 专栏收录该内容

34 篇文章

订阅专栏

本文介绍了如何在在线和离线环境下使用Conda和pip管理PyTorch、transformers等库，以及如何在离线情况下下载和使用预训练的Bert模型，包括git-lfs的使用技巧。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

环境

在线

conda create -n torch110 python=3.7
conda activate torch110
conda install pytorch==1.10.0 torchvision==0.11.0 torchaudio==0.10.0 cudatoolkit=11.3 -c pytorch -c conda-forge
pip install transformers==4.30.0

离线

# 原环境打包 待打包环境需提前安装conda-pack（conda install conda-pack）
conda-pack -n <env_name> [-o <zip_name>]

# 解压为新环境 解压到anaconda的env目录下即可
mkdir <env_name>
tar -zxvf <evn_name>.tar.gz -C <env_name>

Bert

# 测试程序
from transformers import BertTokenizer, BertModel

# 离线若提示没有模型“bert-base-uncased”可以尝试将参数替换为“./bert-base-uncased”
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
model = BertModel.from_pretrained("bert-base-uncased")
text = "Replace me by any text you'd like."
encoded_input = tokenizer(text, return_tensors='pt')
output = model(**encoded_input)
print(output)

在线

直接运行测试程序，将自动下载相关模型（上例中为“bert-base-uncased”）

离线

将仓库下载到本地

# 在git中执行一次即可
git lfs install

# GIT_LFS_SKIP_SMUDGE=1表示不下载大文件（大文件一般为参数文件，分别对应不同深度学习框架，一般只需要手动下载pytorch版本即可）
GIT_LFS_SKIP_SMUDGE=1 git clone git@hf.co:bert-base-uncased