Hugging Face 模型/数据集国内加速下载指南

@LijinLiu

于 2025-06-21 15:30:21 发布

阅读量2.2k

点赞数 25

CC 4.0 BY-SA版权

分类专栏： Python 高效编程手册文章标签： python 人工智能目标检测计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_70043030/article/details/148810946

Python 高效编程手册专栏收录该内容

3 篇文章

订阅专栏

🚀 Hugging Face 模型/数据集国内加速下载指南（ HF-Mirror 教程）

📅 更新时间：2025年6月
🧠 作者：@lijin6
🎯 关键词：huggingface、模型下载加速、HF-Mirror、hfd、huggingface-cli、国内AI开发者

🧩 为什么需要加速 Hugging Face 下载？

Hugging Face 是当前最受欢迎的 AI 模型平台，包含了诸如 LLaMA、GPT、SAM、Diffusers 等前沿模型。但由于其服务器在海外，国内下载 Huggingface 模型经常出现断连、超时、龟速等问题，严重影响开发效率。

为了解决这个痛点，开源社区开发了多种加速方案，尤其推荐 HF-Mirror 镜像站，本文将全面介绍其使用方式。

🌐 HF-Mirror 简介

官网地址： https://hf-mirror.com
这是一个由国内开发者维护的 公益 Hugging Face 镜像服务站，支持以下特性：

✅ 提供稳定、快速的模型与数据集下载；
✅ 支持 huggingface-cli 命令行；
✅ 支持环境变量无侵入式加速；
✅ 提供基于 aria2 的高速下载工具 hfd；
✅ 支持 Gated Repo 的 token 下载。

✅ 方法一：直接网页搜索下载

适用于模型数量少、不常更新时：

打开 https://hf-mirror.com
搜索你需要的模型，比如 gpt2
点击 Files and versions，直接选择你需要的 .bin、.json 文件进行下载

✅ 方法二：huggingface-cli 命令行加速

1️⃣ 安装依赖：

pip install -U huggingface_hub

2️⃣ 设置环境变量：

Linux/macOS：

export HF_ENDPOINT=https://hf-mirror.com

Windows PowerShell：

$env:HF_ENDPOINT = "https://hf-mirror.com"

建议将其添加到你的 .bashrc 或 PowerShell 配置文件中。

3️⃣ 下载模型/数据集：

下载模型：

huggingface-cli download --resume-download gpt2 --local-dir gpt2

下载数据集：

huggingface-cli download --repo-type dataset --resume-download wikitext --local-dir wikitext

💡 使用 --local-dir-use-symlinks False 可禁用软链接，便于打包或直接部署。

✅ 方法三：使用 hfd 高速下载器（推荐）

hfd 是 HF-Mirror 提供的轻量级模型下载脚本，底层基于 aria2 支持断点续传和多线程，非常适合下载大模型。

1️⃣ 下载 hfd 工具：

wget https://hf-mirror.com/hfd/hfd.sh
chmod +x hfd.sh

2️⃣ 设置镜像地址：

export HF_ENDPOINT=https://hf-mirror.com

3️⃣ 下载命令示例：

下载模型：

./hfd.sh gpt2

下载数据集：

./hfd.sh wikitext --dataset

🔐 下载需要授权的 Gated Repo：

./hfd.sh meta-llama/Llama-2-7b --hf_username YOUR_NAME --hf_token hf_***

✅ 方法四：非侵入式加速（代码中设置环境变量）

适用于已有代码框架、无法改写调用方式的情况：

HF_ENDPOINT=https://hf-mirror.com python your_script.py

如在 Transformers 中使用 from_pretrained() 时也会自动读取该变量。

❓ 常见问题解答

Q: 为什么有些模型提示没有权限？

A: Gated 模型（如 LLaMA、Stable Diffusion XL）需要在官网申请授权并登录，然后使用 access token 下载。

Q: 如何获取 token？

登录 huggingface.co
前往 https://huggingface.co/settings/tokens
创建新的 Access Token

❤️ 最后

HF-Mirror 是一个非常棒的国内公益项目，极大提升了我们使用 Hugging Face 的效率。如果你觉得有帮助，欢迎前往官网左下角扫码支持一下维护者！

📢 项目地址： https://hf-mirror.com

📌 参考链接

HF-Mirror 教程主页：https://hf-mirror.com
huggingface-cli 官网文档：https://huggingface.co/docs/huggingface_hub
Huggingface Datasets：https://huggingface.co/datasets

📬 如果这篇文章对你有帮助，欢迎点赞、收藏、评论支持我持续更新 AI 工具技巧！也欢迎留言分享你自己的加速经验 🚀

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。