换源下载huggingface上的模型

原创已于 2024-10-19 21:46:12 修改 · 745 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python #人工智能

于 2024-08-21 22:13:59 首次发布

部署运行你感兴趣的模型镜像

自己用huggingface的transformers库跑示例的时候发现一直time out，可能是需要翻墙的原因，但我用的是某平台的计算资源，只能在jupyter里面操作，于是想试试换源。搜索之后，发现可以从镜像网站上快速进行git下载。具体操作如下：

首先得安装git-lfs，可用如下命令

sudo apt install git-lfs

然后检验一下是否能成功初始化

git lfs install

成功的话会出现Git LFS initialized.

如果出现了Error: Failed to call git rev-parse --git-dir --show-toplevel: "fatal: not a git repository (or any of the parent directories): .git\n"，说明还未进行初始化，可以用

git init

初始化当前目录为git仓库，然后再git lfs install。

然后从镜像网站上下载你想要的模型，我使用的是https://hf-mirror.com/，比如想下载CodeLlama-7b-Python-hf，则用如下命令

git clone https://hf-mirror.com/codellama/CodeLlama-7b-Python-hf

您可能感兴趣的与本文相关的镜像

ACE-Step

音乐合成

ACE-Step

ACE-Step是由中国团队阶跃星辰（StepFun）与ACE Studio联手打造的开源音乐生成模型。它拥有3.5B参数量，支持快速高质量生成、强可控性和易于拓展的特点。最厉害的是，它可以生成多种语言的歌曲，包括但不限于中文、英文、日文等19种语言

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

myccmj

关注关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

huggingface高速下载模型的实战代码

herosunly的博客

01-27

28万+

本文主要介绍了huggingface高速下载模型的实战代码，尤其是无法通过国内源进行下载的huggingface模型，希望能对学习大模型的同学们有所帮助。需要特别说明的是，本文的代码是完全原创的，即能够最大限度利用宽度的速度，而且还能实现断点续传。文章目录 1. 背景 2. 实战代码

huggingface无法下载模型的实战代码

最新发布

m0_56312629的博客

11-10

308

huggingface下载源修改为国内

书生·浦语大模型实战营第二次课堂笔记

m0_68165821的博客

01-09

714

人工智能领域中参数数量巨大、拥有庞大计算能力和参数规模的模型利用大量数据进行训练拥有数十亿甚至数千亿个参数模型在各种任务重展现出惊人的性能InternLM-Xcomposer-7B 介绍浦语·灵笔是基于书生·浦语大语言模型研发的视觉-语言大模型，提供出色的图文理解和创作能力具有多项优势:1.为用户打造图文并貌的专属文章2.设计了高效的训练策略，为模型注入海量的多模态概念和知识数据，赋予其强大的图文理解和对话能力。

HuggingFace换源

GodGump的博客

05-19

2399

进入huggingface的主页然后找到设置(setting)点击show以后，获取token。在需要换源的文件前加上下列代码。在需要换源的文件前加上下列代码。

Huggingface_hub更换下载源

Cynbage的博客

07-04

418

找到环境中Huggingface_hub库所在的位置，例如“\anaconda3\envs\env-name（你的环境的名字）\Lib\site-packages\huggingface_hub”，找到其中的constants.py文件，用记事本打开，将其中HUGGINGFACE_CO_URL_HOME与_HF_DEFAULT_ENDPOINT的值修改为"https://hf-mirror.com"，保存后关闭即可。），可能是由于网络限制、代理问题或访问速度过慢。具体原因是网络连接超时（

下载HuggingFace模型的最终解！

Sam Zhu

12-18

909

因为近来刚好有点时间，之前又有做一些大模型相关的工作，所以决定写点有用的文档，希望可以帮助到大模型初学者。下载HuggingFace模型又是学习大模型的关键一步（得先学会借鉴嘛不是），所以有了这个文档。: 可选参数，用于指定下载时要排除的文件模式。: 用于指定想要下载的模型或数据集的Hugging Face标识符，格式通常为’repo/model_name’。: 可选参数，Hugging Face账户的用户名。: 可选参数，用来标记下载的是数据集而非模型。如果要下载的是数据集，需要添加此参数。

玩转大语言模型——ollama导入huggingface下载的模型

艾醒的博客

01-06

4337

ollama在大语言模型的应用中十分的方便，但是也存在一定的问题，比如不能使用自己微调的模型或者当前的模型并没有做ollama官网兼容的时候，从外部导入模型就十分必要。本章将会介绍两种常见格式模型导入ollama的方式。

huggingface入门:如何使用国内镜像下载huggingface中的模型

艾醒的博客

08-23

1065

本文介绍了两种下载HuggingFace模型的镜像解决方案：ModelScope和HF-Mirror。针对网络问题导致的模型下载失败，推荐使用镜像网站结合迅雷下载工具。ModelScope提供模型搜索和Python下载功能，支持指定本地保存路径；HF-Mirror则提供Git和迅雷两种下载方式。两种镜像网站都能有效解决直接访问HuggingFace的困难，其中迅雷下载方式最为便捷高效。文中详细说明了各平台的具体操作步骤和下载方法。

huggingface通过更改域名切换国内镜像源hf-mirror

m0_54007171的博客

07-20

2120

【代码】huggingface通过更改域名切换国内镜像源hf-mirror。

HuggingFace——切换国内源下载

Irving.Gao的博客

11-11

1356

【代码】HuggingFace——切换国内源下载。

换源下载Huggingface模型权重，以及出现[Errno 13] Permission denied : ‘/.cache‘

ljt998的博客

07-10

2014

是由于huggingface会默认去/home/ubuntu的/.cache文件夹下读取已下载的模型权重，而/.cache无读写权限。因此，需要修改Huggingface的环境变量HF_HOME，使用/.cache以外的其他目录作为缓存路径。

快速设置HuggingFace镜像源：简单易懂教程

DaVenci的博客

04-15

3万+

快速简单的设置huggingface镜像源，让模型跑起来。

[NLP]Huggingface模型/数据文件下载方法

摩登都市天空---专栏

07-24

6710

作为一名自然语言处理算法人员，hugging face开源的transformers包在日常的使用十分频繁。在使用过程中，每次使用新模型的时候都需要进行下载。如果训练用的服务器有网，那么可以通过调用from_pretrained方法直接下载模型。

huggingface_hub 设置国内镜像

jasonhongcn的专栏

06-27

7185

要设置HuggingFace Hub的国内镜像，你可以按照以下步骤进行操作，以确保从国内镜像站点下载Hugging Face模型和数据集。

大模型笔记之-如何从huggingface克隆源码及模型文件

JunHowie的个人Blog

11-09

1672

本文将介绍怎么使用git clone的命令获取huggingface的文件。

transformers模型默认下载地址

alim2012的博客

07-21

3928

运行下段代码，系统会下载模型。

huggingface上下载模型

07-13

要从 Hugging Face 平台下载预训练模型，可以通过其 `Transformers` 库提供的 `from_pretrained` 方法轻松实现。以下是具体的操作步骤和代码示例： ### 使用 Transformers 库下载模型 1. 安装必要的库（如果尚未安装）： ```bash pip install transformers ``` 2. 使用 Python 脚本下载模型。以下是一个使用 `AutoModel` 和 `AutoTokenizer` 下载 `bert-base-uncased` 模型的示例： ```python from transformers import AutoTokenizer, AutoModel # 指定模型名称 model_name = "bert-base-uncased" # 初始化 Tokenizer tokenizer = AutoTokenizer.from_pretrained(model_name) # 编码输入文本 text = "This is a test sentence." encoded_input = tokenizer.encode(text, return_tensors="pt") print("Encoded input:", encoded_input) # 下载并加载模型 model = AutoModel.from_pretrained(model_name) # 获取模型输出 output = model(encoded_input) print("Model output:", output) ``` ### 指定本地存储路径如果你希望将模型保存到特定的本地路径，而不是默认的缓存目录，可以使用 `cache_dir` 参数来指定存储路径： ```python from transformers import AutoTokenizer, AutoModel model_name = "bert-base-uncased" cache_dir = "./models" # 自定义模型存储路径 # 指定 cache_dir 参数 tokenizer = AutoTokenizer.from_pretrained(model_name, cache_dir=cache_dir) model = AutoModel.from_pretrained(model_name, cache_dir=cache_dir) ``` 此方法会将模型文件下载并保存到 `./models` 目录下，避免默认存储在用户目录中。 ### 使用镜像源加速下载（适用于国内用户）由于网络原因，国内用户可能无法顺畅访问 Hugging Face 的官方源。可以使用国内镜像源加速模型下载，例如官方推荐的镜像 `https://hf-mirror.com` 或其他国内镜像源。使用方法如下： ```python from transformers import AutoTokenizer, AutoModel # 使用镜像源 model_name = "bert-base-uncased" mirror_url = "https://hf-mirror.com/models/{}/resolve/main/config.json".format(model_name) # 指定 `revision` 参数为镜像地址 tokenizer = AutoTokenizer.from_pretrained(model_name, revision="main", mirror="https://hf-mirror.com") model = AutoModel.from_pretrained(model_name, revision="main", mirror="https://hf-mirror.com") ``` 此外，也可以通过设置环境变量 `HF_ENDPOINT` 来全局使用镜像源： ```bash export HF_ENDPOINT=https://hf-mirror.com ``` ### 使用 CLI 命令行工具下载模型 Hugging Face 还提供了命令行工具 `huggingface-cli`，可以通过以下方式下载模型： 1. 安装 Hugging Face CLI 工具： ```bash pip install huggingface_hub ``` 2. 使用命令行下载模型： ```bash huggingface-cli download bert-base-uncased --repo-type model --revision main ``` 该命令会将 `bert-base-uncased` 模型下载到当前目录。 ### 模型缓存机制 Hugging Face 默认会将模型缓存到本地路径（如 `~/.cache/huggingface/transformers`）[^3]，以避免重复下载。如果你希望强制重新下载模型，可以使用 `force_download=True` 参数： ```python from transformers import AutoModel model = AutoModel.from_pretrained("bert-base-uncased", force_download=True) ``` 这将忽略本地缓存并强制从远程服务器下载模型。 ---