下面,我们结合Kaggle赛题:Avazu:Click-Through Rate Prediction,练习数据挖掘技术在CTR预估中的应用。
本文内容包括赛题任务简析,以及基于LR(逻辑斯蒂回归)的初步实现。
本文的源码托管于我的Github:PnYuan - Kaggle_CTR,欢迎查看交流。
1.任务概述
CTR(Click Through Rate,点击率),是“推荐系统/计算广告”等领域的重要指标,对其进行预估是支持进一步地“商品推送/广告投放”等决策的基础。Avazu:Click-Through Rate Prediction是Kaggle2015举行的一场CTR预估比赛。赛事主办方提供了规约化的历史数据(train.csv)与待预测数据(test.csv),下述条目给出了该赛事任务的一些基本信息:
任务输入:数据集文件:train.csv 和 test.csv。
任务输出:给出预测集id所对应的CTR预估值,形如&#x