背景:
《Click Prediction for Product Search on C2C web sites 》上海交大的计算机系的论文。论文说数据来自 “a real popular c2c web site”,看论文图片,应该是ebay.com的图片。ebay在上海有研究所吗? 论文上图片是搜索“nokia e63”,有兴趣可以点击来看看。很奇怪的是,论文为什么不直接点明是ebay的数据研究。
开始介绍c2c交易量巨大,因此预测商品的点击可能性对用户体验非常重要。
商品的点击可能性分数可以用在哪些地方?用于排序;浏览-点击-购买=转化率。
利用CTR可以非常方便的技术有历史行为的商品,然后不利用新的商品,因为新的商品当然没有历史行为可以计算。对应新的商品,很自然的想法是用卖家的历史、好评率、商品价格、得到因素来预测相应的点击可能性。
实际上,研究点击可能性更加透彻的是广告搜索(Sponsored Search;Sponseored Search Auction)。研究用途应该是用来改善排序,过滤,位置放置,广告出价。
基本方法:
罗列影响点击的因素,组织为特征,然后应用点击或者不点击(购买或者不购买)作为训练的目标。0-1目标特别适合用logit回归的方法。