Kaggle入门指南(Kaggle竞赛)
文章免费
Kaggle号称是全球最大的数据科学家汇聚的平台,高手云集,同时对萌新也很友好。
Kaggle网址:https://www.kaggle.com
简介
Kaggle 是一个广受欢迎的平台,专注于数据科学和机器学习领域。它为数据科学家提供了丰富的资源与环境,从竞赛到数据集的分享,再到社区的互动,Kaggle 为各个层次的学习者提供了宝贵的机会。本文将深入探讨如何在 Kaggle 上开始旅程,包括平台的基本功能、竞赛的参与以及构建和共享项目的步骤。
注册与设置
创建账户
要开始使用 Kaggle,首先需要创建一个账户。访问 Kaggle 官网:https://www.kaggle.com/ ,点击“Sign Up”进行注册。注册过程相对简单,只需填写基本信息并验证邮箱即可。
注意:
- 如果邮箱无法收到邮件,查看垃圾邮件是否存在,如果没有则更换邮箱
- 国内原因,出现不了人机验证从而导致无法完成注册,可以使用科学上网或其他方式
完善个人资料
完成注册后,可以在个人资料页面上完善信息,包括上传头像、填写个人简介和展示技能。这有助于在社区中建立个人品牌,并与其他用户建立联系。
参与竞赛
找到合适的竞赛
在 Kaggle 的“Competitions”标签下,可以找到各种竞赛。根据个人兴趣和技能选择合适的竞赛进行参与。
下载比赛数据
在比赛页面下的data标签里面下载对应比赛的数据集
模型训练
线下训练
下载比赛数据集,并创建模型训练
线上训练
在Kaggle Notebooks上创建模型并训练
Datasets介绍
点击下图中的【Your work】可以找到你自己的Datasets。点击【New Dataset】按照相关提示即可创建自己的Dataset
注意:Dataset主要是Kernel用来在不联网时加载模型、安装库
Kaggle Kernel介绍
Kaggle Kernel是Kaggle平台提供给选手的运行环境,可以视为一个在线的Notebook,在线的Nobteook可以用于完成比赛的提交
点击下图中的【Your work】可以找到你自己的Notebook。
Notebook的编辑状态和Jupyter Notebook没有什么区别,主要的界面组成元素有:
-
代码编辑区:运行代码,也支持Markdown格式;
-
数据集(Dataset):加载比赛数据集 或 模型 或 库安装代码
-
运行设置:代码运行配置
-
- Environment:运行环境
- Accelerator:CPU/GPU/TPU
- GPU Quota:GPU每周运行时长
- Internel:是否联网
- Language:运行语言,Python或者R
- Environment:运行环境
Dataset使用
Dataset主要是Kernel用来在不联网时加载模型、安装库。在Notebook的编辑状态,点击右边的【Add data】可以加载Dataset。
注意:Dataset可以用来加载线下训练的模型
提交结果
【注意】对于Kaggle比赛,一般采用Notebook线上提交,此时模型预测代码不能联网,所以需要在关闭Internet的情况下完成【库安装】、【模型加载】和【模型预测】
直接提交
注意:
- Kaggle比赛提交失败也会计算提交次数
- 每周使用使用GPU、TPU时间有限,注意分配(线上训练时注意)
- 没有GPU时间时不能进行GPU方式提交
- 提交一般有时间限制,注意模型推理耗时
提交成功后,在比赛页面里的Submissions标签下有相关显示
其他
Ultralytics多模态融合(可见光与红外光)目标检测与分割检测
https://blog.youkuaiyun.com/baidu_34487688/article/details/144188629