【数据科学赛】OTTO – Multi-Objective Recommender System #多目标建模 #推荐系统 #$30,000

本次竞赛由德国电商巨头OTTO发起,旨在建立一个多目标推荐系统,预测电商平台上的点击、加购物车及下单行为。参赛者需基于用户会话中的历史事件来优化推荐算法,提高在线零售商向顾客推荐商品的相关性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

CompHub 实时聚合多平台的数据类(Kaggle、天池…)和OJ类(Leetcode、牛客…)比赛。本账号会推送最新的比赛消息,欢迎关注!

更多比赛信息见 CompHub主页 或 点击文末阅读原文


以下内容摘录自比赛主页

Part1赛题介绍

1题目

OTTO – Multi-Objective Recommender System

2标签

推荐系统多目标建模

3主办方

Otto (GmbH & Co KG)。它是德国的邮购公司,也是世界上最大的电子商务公司之一。

4背景

Your work will help online retailers select more relevant items from a vast range to recommend to their customers based on their real-time behavior. Improving recommendations will ensure navigating through seemingly endless options is more effortless and engaging for shoppers.

Part2时间安排

  • November 1, 2022 - Start Date.

  • January 24, 2023 - Entry Deadline. You must accept the competition rules before this date in order to compete.

  • January 24, 2023 - Team Merger Deadline. This is the last day participants may join or merge teams.

  • January 31, 2023 - Final Submission Deadline.

All deadlines are at 11:59 PM UTC on the corresponding day unless otherwise noted. The competition organizers reserve the right to update the contest timeline if they deem it necessary.

Part3奖励机制

  • 1st Place - $ 15,000

  • 2nd Place - $ 10,000

  • 3rd Place - $ 5,000

Part4赛题描述

电商平台的多目标建模,目标包括:点击、加购物车、下单。

The goal of this competition is to predict e-commerce clicks, cart additions, and orders. You'll build a multi-objective recommender system based on previous events in a user session.

Part5评测标准

Submissions are evaluated on Recall@20 for each action type, and the three recall values are weight-averaged:

{'clicks': 0.10, 'carts': 0.30, 'orders': 0.60}


### 关于 Kaggle Otto 多目标推荐系统详情与资源 ####背景介绍 Otto 集团举办的多目标推荐系统挑战旨在解决电子商务中的个性化商品推荐问题。该竞的目标是开发一种算法,能够基于用户的购买历史和其他行为数据预测用户可能感兴趣的商品类别[^1]。 #### 数据集描述 参者可以获得由 Otto 提供的数据集,其中包括匿名化后的客户交易记录以及产品信息。这些数据被分为训练集和测试集两部分用于模型构建与评估。具体来说: - **train.csv**: 包含了客户的特征向量及其对应的多个标签(即不同类别的商品) - **test.csv**: 只有特征而无标签,用来提交最终预测结果给平台评分 - **sample_submission.csv**: 展示了如何格式化提交文件 #### 评价标准 为了衡量各队伍的表现,采用了平均精度均值 (mean average precision at k, MAP@k) 的度量方式来计算排名分数。MAP@k 是一个广泛应用于检索任务上的性能指标,在这里它反映了对于每一个查询返回前 K 条结果中有多少条是真正相关的。 #### 技术路线建议 针对此类问题可以考虑采用以下几种方法论来进行探索: - 使用传统机器学习算法如随机森林、XGBoost等建立基线模型; - 尝试神经网络架构特别是那些专为处理序列型输入设计的RNN/LSTM单元; - 探索图卷积网络(GCNs),因为它们擅长捕捉节点间复杂关系从而有助于理解顾客偏好模式; - 结合协同过滤技术挖掘相似用户群体之间的潜在联系; ```python import pandas as pd from sklearn.model_selection import train_test_split from lightgbm import LGBMClassifier from sklearn.metrics import make_scorer, average_precision_score # 加载数据 data = pd.read_csv('path/to/train.csv') # 特征工程... features = data.drop(['id', 'target'], axis=1).values labels = data['target'].str.get_dummies().values # 划分训练验证集合 X_train, X_val, y_train, y_val = train_test_split(features, labels) # 构建LightGBM分类器并训练 clf = LGBMClassifier() clf.fit(X_train, y_train) # 自定义评估函数 def map_k(y_true, y_pred): return average_precision_score(y_true, y_pred) map_scorer = make_scorer(map_k, needs_proba=True) score = map_scorer(clf, X_val, y_val) print(f'Validation set score: {score}') ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值