天池- IJCAI-18 阿里妈妈搜索广告转化预测新手入门经历(完:观看决赛答辩感想)

博客分享了天池比赛中关于广告转化预测的团队经验,包括拜拉席恩队的Binning、交叉特征进阶、强特征和权重设置,以及DOG队的迁移学习、词袋模型、穿越特征和冷启动问题。还讨论了模型融合、反作弊策略、缺失值处理和业务理解的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

早一段时间看了决赛的答辩直播,作为一只萌新,决赛中提到的一些trick其实许多都有用到,但是没能够整合起来形成系统的框架,东拼西凑,自己都不知道一些trick的效果如何也加了进去,所以效率还是低了一些。


决赛是用前7天的数据预测第8天下午的购买量。比之初赛的难度加大。

拜拉席恩队

1.Binning

之前一直不知道在第一部分里的分段函数的专业名词叫啥,原来是叫做binning,分箱的意思,为了避免过拟合。

例如user_age_level字段,分成7个年龄段,10-20,20-30...80-90,之类的,实际上我们知道接受互联网的大概是80后,现在的80后大概是40岁,40岁之后的人对互联网感到更加新鲜,更有可能去点击广告,那么后面几个分段就没必要划得那么细。

分箱的作用就在于,把该特征用广告点击率转化率排序(is_trade),直接体现各个年龄段的人点击广告的概率的大小。


2.交叉特征的进阶(属性排序特征)

排序特征:衣服这一类目中的点击率排序

前面做了各个特征的点击率排序,但没有想过用item_category中的小字段排序,比如item_category_1中“白色”、“轻薄”、“长续航”的点击率最高,这其实也是一个特征。如果一个商品同时包含“白色”、“轻薄”,也应该给一个较高的点击率预期。

而在后面答辩的花志祥也提到类似的概念,表征特征:如果一个用户点了三个item都有红色这一属性,那么这个人可能偏好红色。

3.一个强特

用户点击的时间差,并且还要与

### 关于IJCAI-18 阿里妈妈搜索广告转化预测大赛 #### 大赛背景与目标 IJCAI-18 阿里妈妈搜索广告转化预测大赛旨在通过提供大规模的真实电商数据集,鼓励参赛者利用机器学习和数据分析技术来提高广告点击率的预测准确性。比赛的目标是帮助电商平台更精准地推荐商品给潜在客户,从而提升用户体验并增加销售额。 #### 数据描述 比赛中使用的数据来自阿里巴巴旗下的淘宝网,涵盖了用户的浏览行为、购买记录以及广告展示情况等多个维度的信息。这些丰富的特征为模型训练提供了坚实的基础[^1]。 #### 特征工程中的分箱处理 为了更好地捕捉不同年龄层用户对广告的兴趣差异,在预处理阶段采用了基于点击率(CTR)的分箱方法。具体来说,就是按照`is_trade`字段将样本按年龄段划分成若干区间,并计算各区间内的平均CTR作为代表值。这种方法能够直观反映特定群体对于广告响应的可能性高低[^2]。 #### 提交要求与评估标准 参赛队伍需提交一份包含预测结果的概率分布文件;最终成绩依据AUC指标衡量,即曲线下面积越大表示分类效果越好。此外还设有额外奖励机制用于表彰那些不仅性能优异而且具备创新性的解决方案。 ```python import pandas as pd from sklearn.model_selection import train_test_split # 假设df为加载后的原始DataFrame对象 X_train, X_test, y_train, y_test = train_test_split(df.drop('label', axis=1), df['label'], test_size=0.2) def age_bucketing(dataframe): bins = [0, 18, 25, 35, 45, 60, float('inf')] labels = ['<18', '18-25', '26-35', '36-45', '46-60', '>60'] dataframe['age_group'] = pd.cut(dataframe.age, bins=bins, labels=labels) return dataframe.groupby(['age_group']).mean()['is_trade'] print(age_bucketing(X_train)) ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值