OSError: Can‘t load tokenizer for ‘bert-base-chinese‘. If you were trying to load it from ‘https://h

原创已于 2024-02-28 10:28:53 修改 · 4.6k 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#bert #人工智能 #深度学习

于 2024-02-28 10:28:41 首次发布

背景

使用hugging face 中的transformers库无法加载预训练模型文件

问题预测

看到网上说是transformers版本太久，但是我的已经是最新版，估计是国内网络无法连上服务器，没法下载权重文件。参考资料：hugging face 无法加载预训练模型：OSError: Can‘t load config for ‘hfl/chinese-macbert-base‘. If you were trying_config.json not found in huggingface hub-优快云博客

解决方案

上述的博客是手动下载的方式，如果有魔法也可以直接连外网，重新运行程序会自动下载（本人的做法）

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

fok waijyun

关注关注

14
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

OSError: Can‘t load tokenizer for ‘facebook/wav2vec2-large-xlsr-53‘. If you were trying to load it

沉迷单车的追风少年

05-21

369

在使用facebook/wav2vec2-large-xlsr-53进行音频编码时，遇到了无法加载分词器的问题，错误提示为OSError: Can't load tokenizer for 'facebook/wav2vec2-large-xlsr-53'。

transformers 加载模型时报错

qq_34373543的博客

12-18

9158

transformers加载模型时报错安装transformers后，拿下面的代码测试： from transformers import AutoTokenizer, TFAutoModel tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased") model = TFAutoModel.from_pretrained("bert-base-uncased") inputs = tokenizer("Hello world!", ret

参与评论您还未登录，请先登录后发表或查看评论

报错解决MaxRetryError(“HTTPSConnectionPool(host=‘huggingface.co‘, port=443):xxx“)

热门推荐

weixin_43495948的博客

10-03

3万+

那我的机器就是没有数据传输过来，当然前提是你自己的服务器一定要有网络连接（可以尝试ping www.baidu.com来检测自己机器是否有网络）。首先造成这种错误的原因主要是因为你的服务器没有办法连接huggingface的原因，你可以直接在你的服务器上尝试能否直接ping。就可以运行你的代码了，但是这里运行的时候有个小问题，

facebook文本生成音乐项目-audiocraft 安装教程

fanfanfan的博客

06-14

3984

facebook的文本生成音乐的大模型项目！

OSError: Can‘t load tokenizer for ‘bert-base-chinese‘

自己在学习过程中的总结

04-02

1万+

使用`from_pretrained()`函数从预训练的权重中加载模型时报错：OSError: Can't load tokenizer for 'bert-base-chinese'. If you were trying to load it from 'https://huggingface.co/models', make sure you don't have a local directory with the same name.

运行Clip多模态模型报错：OSError: Can‘t load tokenizer for ‘bert-base-chinese‘

liu5z666的博客

03-14

1146

然后将net/clip.py的from_pretrained（）部分换为下载了以上模型的绝对路径。继续运行发现存在np版本更新的问题，将utils/utils_aug.py的np.int换为np。1.OSError加载模型文件出现。，将以下三个文件下载到本地。

OSError: Can‘t load tokenizer for ‘bert-base-uncased‘. If you were trying to load it from

"You are worthy! You can do it!"

06-27

6255

将下载的权重文件，放到某个文件夹下（加载路径的位置）。，Models页面，下载对应的Bert模型的权重。修改权重文件的加载路径 ——页面，因此不能下载相应的权重。解决方法：手动下载文件到本地。函数里面的权重文件路径，必须写。

OSError: Can‘t load tokenizer for ‘roberta-base‘. If you were trying to load it from ‘https://huggin

最新发布

weixin_44012667的博客

03-28

1309

OSError: Can‘t load tokenizer for ‘bert-base-chinese‘_oserror: can't load tokenizer for 'bert-base-chine-优快云博客。

安装BLIP2模型时报错：Can‘t load tokenizer for ‘bert-base-uncased‘. If you were trying to load it from ‘h ...

weixin_45840973的博客

09-02

865

安装BLIP2模型报错

【hugging face无法加载预训练模型】OSError：Can‘t load config for ‘./bert-base-uncased‘. If you‘re trying

小白冲鸭的博客

01-09

3995

当运行以下两行代码时，明明已经将下载到本地的bert-base-uncased模型放到了当前py文件的目录下，

解决报错：OSError: Can‘t load tokenizer for ‘bert-base-chinese‘.

lnbbbb的博客

11-14

1627

最近复现代码发现这个错误，上网找了好多方法（关防火墙，用魔法，下载到本地（因为是刚下的代码，不知道绝对路径应该填哪里）等），发现都没啥用。库（好像这个库比较旧？现在都用transformers库？但我transformers库一直调不通）② 代码由 from transformers import BertModel。③ 调用bert-base-chinese。使用方法可以自行看看官方文档或问问gpt~

OSError: Can‘t load tokenizer for ‘bert-base-chinese’超简单解决方案

m0_73749469的博客

01-02

1587

快速解决OSError错误

OSError: Can‘t load tokenizer for ‘bert-base-chinese‘无法访问https://huggingface.co/models

weixin_42736657的博客

02-02

1914

使用from_pretrained()函数从预训练的权重中加载模型时报错：OSError: Can’t load tokenizer for ‘bert-base-chinese’. If you were trying to load it from ‘https://huggingface.co/models’, make sure you don’t have a local directory with the same name. Otherwise, make sure ‘bert-base-c

OSError: Can t load tokenizer for bert-base-chinese . If you were trying to load it from

m0_48095841的博客

06-05

1106

所需下载的文件地址：https://pan.baidu.com/s/1trIXxXzqaYXoyJZaSQ11hA?，看网上分析说是连接不上外网导致的，需要科学上网。但使用科学上网也会发生其他类型的错误，索性就直接将模型下载到本地。背景：使用hugging face 中的。

解决Can‘t load tokenizer for ‘bert-base-chinese‘.问题

优快云hdlg的博客

09-05

1281

在运行.py命令前加上HF_ENDPOINT=https://hf-mirror.com就可以成功解决。

【debug】OSError: Can‘t load tokenizer for ‘XXX‘. If you were trying to load it from ‘https://huggingf

prinTao的博客

03-06

1万+

本地目录与 ‘openai/clip-vit-large-patch14’ 同名：如果你的本地目录中有一个名为 ‘openai/clip-vit-large-patch14’ 的文件夹，可能会导致加载错误。请检查你的工作目录或者其他相关目录中是否有同名文件夹，并确保没有命名冲突。模型路径错误：确保 ‘openai/clip-vit-large-patch14’ 是正确的模型路径，可以尝试重新确认模型路径是否正确。

bert模型训练，加载保存的模型Can‘t load tokenizer for ‘/content/drive/MyDrive/Colab Notebooks/classification_mode

weixin_38864554的博客

07-20

8403

bert模型加载，报错“Can't load tokenizer for '/content/drive/MyDrive/Colab Notebooks/classification_mode”

OSError: Can't load tokenizer for 'gpt2'. If you were trying to load it from 'https://huggingface.co

10-25

这个错误提示是Hugging Face Transformers库在尝试加载预训练模型GPT-2的tokenizer时遇到的问题。`OSError: Can't load tokenizer for 'gpt2'`表示系统无法找到或加载名为'gpt2'的tokenizer文件。通常，这可能是由于以下几个原因： 1. **tokenizer文件路径问题**：你可能需要确认tokenizer文件是否已经下载并正确保存在本地，或者指定正确的文件路径。 2. **网络连接问题**：如果你是从远程URL下载tokenizer，确保网络连接正常并且可以访问Hugging Face Hub。 3. **版本不匹配**：如果使用的transformers版本与tokenizer的版本不一致，也可能会导致加载失败。检查一下库版本是否是最新的，并尝试更新到支持该tokenizer的版本。 4. **环境配置**：确保Python环境变量设置正确，如`TOKENIZERS_PARALLELISM`等，有时这些环境变量会影响tokenizer的加载。解决这个问题的一般步骤包括检查文件、更新依赖、清理缓存或重新下载tokenizer。如果你是在使用Jupyter Notebook，可能需要运行`!pip install transformers --upgrade`来刷新库。