kaggle比赛中的private leaderboard和public leaderboard的区别

本文详细解析了Kaggle竞赛中PublicLB和PrivateLB的运作机制,阐述了测试集如何被划分为两个部分,以及这两部分在比赛过程中的不同作用。作者强调了不要过度依赖PublicLB,而应该关注模型的泛化能力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

特别说明一下Kaggle 在计算得分的时候,有Public Leaderboard (LB)和 Private LB 之分。具体而言,参赛选手提交整个测试集的预测结果,Kaggle 使用测试集的一部分计算得分和排名,实时显示在 Public LB上,用于给选手提供及时的反馈和动态展示比赛的进行情况;测试集的剩余部分用于计算参赛选手的最终得分和排名,此即为 Private LB,在比赛结束后会揭晓。用于计算 Public LB 和 Private LB 的数据有不同的划分方式,具体视比赛和数据的类型而定,一般有随机划分,按时间划分或者按一定规则划分。大家可以合理利用Public Leaderboard的排名和反馈来适当调整自己的策略,但是不要太过依赖Public Leaderboard,有些时候它的数据分布和Private Leaderboard会有差异,不要在Public Leaderboard上过拟合哦,还是好好利用你的validation set吧,以便得到更好的泛化能力。

感谢Chi Yu's Blog的解释:

我提交过,已经搞懂了,意思就是:
kaggle给的测试集中包含AB两部分,
但是不告诉你哪部分是A,哪部分是B.
要求你按次序提交这个测试集每条数据的预测结果.
提交后,因为你是按次序提交的,所以kaggle服务器自己知道哪些序号对应的数据结果传给private LB,
哪些传给public LB.
比赛途中,只让看public LB,为了防止参赛者预测结果不具备普适性,参赛结果以private LB为准.

 

转自:https://blog.youkuaiyun.com/pearl8899/article/details/82145480

### 历届Kaggle比赛中的机器学习与深度学习模型 在历届Kaggle比赛中,参赛者们广泛采用了多种机器学习深度学习技术来解决不同的挑战。具体到使用的模型技术,这取决于每场比赛的具体需求以及数据特性。 #### 传统机器学习模型 对于一些结构化数据集的比赛,传统的机器学习算法仍然非常有效。常见的模型包括但不限于随机森林、梯度提升树(GBDT)、XGBoost、LightGBM支持向量机(SVM)[^2]。这类模型通常用于处理具有清晰特征定义的数据集,在预测准确性方面表现出色,并且计算资源消耗相对较低。 #### 深度学习架构 随着计算机视觉、自然语言处理等领域的发展,基于神经网络的解决方案逐渐成为主流: - **卷积神经网络(CNN)**:主要用于图像识别类任务,如ImageNet竞赛中取得优异成绩的就是CNN变体ResNet,VGG,Inception等系列网络结构[^1]。 - **循环神经网络(RNN)及其改进版本LSTM/GRU**:适用于序列数据分析的任务,例如时间序列预测、语音识别及文本情感分析等问题。特别是在处理长依赖关系时效果显著[^4]。 - **Transformer架构**:近年来兴起并迅速普及开来的一种新型编码器解码器框架,最初应用于翻译任务BERT,GPT家族即为此种类型的代表作品;后来也被扩展到了其他NLP应用场景乃至多模态融合方向上去探索更多可能性[^3]。 ```python import torch.nn as nn class SimpleRNN(nn.Module): def __init__(self, input_size, hidden_size, output_size): super(SimpleRNN, self).__init__() self.rnn = nn.RNN(input_size=input_size, hidden_size=hidden_size, batch_first=True) self.fc = nn.Linear(hidden_size, output_size) def forward(self, x): out, _ = self.rnn(x) out = self.fc(out[:, -1, :]) return out ```
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值