从kaggle上下载数据集
kaggle是一个流行的数据科学竞赛平台,同一个问题可以有多个模型来解决,但是研究者不可能在一开始就了解哪些模型是最好的,kaggle应运而生,大家可以在这个平台上集思广益。对于小白来说,诱惑力之一还是平台上众多的数据集。
首选需要下载数据集,一般都是在Python下对kaggle的数据集进行处理,下面默认已安装过Python并且可以使用pip进行Python库的安装。
进入Kaggle官网,注册之后登陆,在搜索页面查找所需数据集,有的数据集能直接下载,大多数需要通过kaggle提供的API下载。
以下为通过kaggle提供的API下载数据集具体操作步骤
其中涉及到的代码信息在github的kaggle API里面有细节解释,文章从一木的文章搬运
1.安装kaggle
在cmd里输入命令 pip install kaggle;完成后输入命令kaggle compitions list检查是否成功安装kaggle库。但是此时一般会报错:Could not find kaggle.json,后面还有文件夹路径。
此时莫慌,进入kaggle官网,点击账户头像 -> my account -> 点击Create New API Token,下载kaggle.json文件,并将其放入报错文件路径,即用户文件里面的.kaggle文件夹中。
2.下载数据集
一般将json文件放进去就可以正常使用了,直接从看上的数据集项目选择API command就可以用python下载数据集了。

如果电脑储存空间管理需求强的,可以选择下载的保存路径
#更改kaggle数据集下载路径
kaggle config set -n path -v <想要存储数据集的位置,最好全英文>
2681

被折叠的 条评论
为什么被折叠?



