项目场景:
数据分析时有的数据来自kaggle,网上没有现成的数据来源,只能从kaggle官网下载,这里就涉及一个下载方式和 下载速度的问题:
- 网页直接Download下载:这种方式下载直观方便,但是有时会遇到进度条一直停滞且网络出现问题的现象
- 使用kaggle官方给出的API接口下载:速度快
从kaggle上下载数据集方法(亲测有效)
kaggle API接口下载
下面以一个案例来阐述上述方法2的下载:
使用方法2前提是需要python环境安装好kaggle第三方包的,由于我的是conda环境,因此,以该环境进行演示:
- 查看安装kaggle第三方包的环境位置
E:\kaggle>kaggle compeitions list
'kaggle' 不是内部或外部命令,也不是可运行的程序
或批处理文件。
一开始认为我的是打开cmd直接安装的,一测试发现不是
- 进入conda查看kaggle所在的虚拟环境
或者使用命令conda list | findstr kaggle
:
(mathmodel) E:\kaggle>conda list | findstr kaggle
kaggle 1.6.17 pypi_0 pypi
- 去kaggle官网复制API到cmd命令行
- 下载结果
记录个人kaggle位置
> kaggle在mathmodel虚拟环境中