从huggingface上下载模型/数据集到服务器或者本地

chnyi6_ya

已于 2025-02-24 11:01:11 修改

阅读量690

点赞数 1

分类专栏：深度学习文章标签：深度学习

于 2023-08-15 23:39:04 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_47505105/article/details/132309438

版权

深度学习专栏收录该内容

104 篇文章

订阅专栏

本文讨论了AllenAI发布的OKVQA数据集，该数据集聚焦于知识驱动的自然语言理解任务，旨在评估模型在处理开放领域问题时对现实世界知识的依赖。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 下载模型

import os
import shutil
from huggingface_hub import snapshot_download

# 直接指定模型和下载路径
model_name = 'openai/clip-vit-base-patch32'
download_path = '/path/to/model/ducumentary'

# 确保下载路径存在
os.makedirs(download_path, exist_ok=True)
print('*'*10, f'Start downloading {model_name}', '*'*10)

# 下载模型
snapshot_download(repo_id=model_name,
                  cache_dir=download_path,
                  local_dir=download_path,
                  local_dir_use_symlinks=False,
                  ignore_patterns=["*.h5","*safetensors","*msgpack"],
                  force_download=True,
                  resume_download=False,
                  etag_timeout=60)


print('*'*10, 'Download finish', '*'*10)

# 清理下载的模型目录
for item in os.listdir(download_path):
    if os.path.isdir(os.path.join(download_path, item)) and item.startswith('models'):
        shutil.rmtree(os.path.join(download_path, item))

2. 下载数据集

from huggingface_hub import snapshot_download

# 设置目标路径
local_dir = "/path/to/dataset/documentary"

# 下载数据集
snapshot_download(
    repo_id="facebook/natural_reasoning",
    repo_type="dataset",
    local_dir=local_dir,
    local_dir_use_symlinks=False,
    resume_download=True
)

3. 具体步骤

在linux系统，先使用命令行：export HF_ENDPOINT=https://hf-mirror.com
创建一个目录，用来当模型/数据集，然后修改代码中的路径
使用命令 nohup python -u download.py>download.log 2>&1 & 让程序在后台运行

博客等级

码龄5年

291
原创

798
点赞

1948
收藏

932
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 并查集的两种优化：路径压缩和按秩合并（两个优化方式可以一起使用）

下一篇：: 最小生成树，Kruskal算法

最新评论

2025/02/25阅读论文笔记：两篇和Spurious Correlations任务的论文
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
2025/02/22阅读论文笔记：2篇多模态大模型（MLLM）在image classification任务上的相关论文
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文笔记：Buffer of Thoughts: Thought-Augmented Reasoning with Large Language Models
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文笔记：African or European Swallow? Benchmarking Large Vision-Language Models for Fine-Grained Object
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文笔记：GREATS: Online Selection of High-Quality Data for LLM Training in Every Iteration
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。