autodl下载hf-mirror数据

背景

使用工具

服务器:AutoDL算力云 | 弹性、好用、省钱。租GPU就上AutoDL

镜像数据集:HF-Mirror

需求介绍

本文的需求是复现下载自动驾驶的transfuser: 

项目:项目首页 - transfuser:[PAMI'23] TransFuser: Imitation with Transformer-Based Sensor Fusion for Autonomous Driving; [CVPR'21] Multi-Modal Fusion Transformer for End-to-End Autonomous Driving - GitCode

数据集:mmahdavi/carla_1.8m at main

开始

步骤0:准备

进入AutoDL的服务器,其中 autodl-tmp 是存放数据的,transfu

AutoDL学术资源加速:

source /etc/network_turbo

更新软件源列表:

sudo apt update

进入数据盘,准备下载数据:

cd autodl-tmp/

本次拟采用:hf-mirror 的方法三(基于 hfd 工具)下载数据集 mmahdavi/carla_1.8m,需按照以下步骤操作:

步骤 1:下载并配置 hfd 工具

  1. 下载 hfd 脚本

    wget https://hf-mirror.com/hfd/hfd.sh
    chmod a+x hfd.sh  # 赋予执行权限
    • 这是 hfd 工具的官方脚本,支持高效下载8。

  2. 设置镜像环境变量

    export HF_ENDPOINT=https://hf-mirror.com  # 临时生效
    • 若需永久生效,可将此行写入 ~/.bashrc 或 ~/.zshrc 文件810。

步骤 2:下载aria2

  1. 依赖安装

    • 若使用 aria2,需提前安装:

      sudo apt-get install aria2  # Ubuntu/Debian
      
  2. 权限问题

    • 若下载目录需要权限(如 /root),需在命令前加 sudo

步骤 3:执行下载命令

  1. 下载数据集

    ./hfd.sh mmahdavi/carla_1.8m --dataset --tool aria2c -x 4
    ./hfd.sh mmahdavi/carla_1.8m --dataset --tool aria2c -x 4 --include "Scenario1.zip"  # 下载指定文件
    
  2. 说明
    • 参数说明

      • --dataset: 指定下载类型为数据集(默认是模型)8。

      • --tool aria2c: 使用 aria2 多线程下载工具加速(需提前安装 aria2)8。

      • -x 4: 指定并行下载线程数(建议设为 4-8)8。

      • --local-dir ./carla_data 指定地址
    • 若未安装 aria2,可省略 --tool 参数,默认使用 wget

      ./hfd.sh mmahdavi/carla_1.8m --dataset
  3. 指定下载目录(可选):

    ./hfd.sh mmahdavi/carla_1.8m --dataset --local-dir ./carla_data
    • --local-dir: 自定义本地存储路径(默认保存到当前目录)8。

  4. 数据集完整性验证

    • 下载完成后,检查目标目录中的文件是否完整:

      ls -l ./carla_data  # 查看文件列表
      du -sh ./carla_data # 查看总大小
      

步骤4:解压文件

确保系统已安装 unzip

# Ubuntu/Debian
sudo apt-get install unzip

直接解压到当前目录:

unzip Scenario1.zip

或指定解压到目标目录(如 scenario1_data):

unzip Scenario1.zip -d scenario1_data

下载结果

下载指定文件

下载全部文件

解压数据

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值