【实验TIP】关于Google Drive上大数据集的下载策略

1.Motivation

深度学习研究在收集数据集的时候,经常遇到开源数据集放到Google Drive上的情况。在碰到较大的数据集时,通常无法先下载到本地,再上传到服务器上。毕竟太慢了。今天在网上查了相关资料,基本掌握了流程。记录在此,方便众人。

总的来说,本博客致力于回答下列问题:

Q1:如何基于本地电脑的Google账户信息在linux服务器上访问Google Drive;

Q2:如何下载其他人共享的大型数据集;

2.Method

2.1. Q1 and A1

下面以本地电脑是windows系统为例进行介绍,推荐使用rclone命令。

在本地电脑上下载rclone.exe,官网地址:Rclone downloads

使用下列命令配置本地电脑的rclone环境,并调用本地Google账号(请查阅其他资料,不再赘述):

rclone config

注意:配置完成后,将本地生成的.config/rclone中的文件,拷贝到Linux服务器用户根目录下的.config/rclone文件夹中(服务器上没有目标文件夹的话,就自己创建)。

如果配置正确,连接成功,那在linux服务器执行下列命令可以输出Google drive下的文件名称:

rclone config show

2.2. Q2 and A2

这一步就可以从云盘下载数据集到服务器上了,但又有新的问题。

一些教程介绍先把数据集保存在自己的云盘上,再用linux服务器从自己云盘上下载。

但如果数据集过大的话,自己的云盘装不下,这一步就没辙了。

推荐使用下列命令,直接从共享文件夹下载数据集,不需要保存到本地。

可以通过如下命令查

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值