预测模型结果校准——前言

 

  1. 对于正负样本十分不均衡的问题,通常先进性负采样,然后再对模型进行校准,可参阅文献[1],博客中介绍了Prior Correction 和 Weighting方法。
  2. 利用分bin的方法,通过统计训练数据的CTR,对预测的CTR进行校准,建立预测CTR到校准后CTR的映射函数,比如Bining方法。
  3. 根据已有的先验知识,以预估值作为变量,观测值作为目标,用回归算法拟合参数。比如Platting Scaling 和Poisson Regression方法。
  4. 不涉及训练数据的CTR,直接通过Isotonic Regression算法,用预测的CTR 拟合训练数据样本的label(1:clicked; 0: not clicked),并保证保序,此外可以通过插值在保证保序的基础上对映射函数进行平滑。

参考文献:

[1] vividfee的博客:<面向稀有事件的 Logistic Regression 模型校准>

 http://vividfree.github.io/机器学习/2015/12/15/model-calibration-for-logistic-regression-in-rare-events-data

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值