
feature select
bitcarmanlee
这个作者很懒,什么都没留下…
展开
-
ctr预估之特征工程
互联网广告综述之点击率特征工程一.互联网广告特征工程博文《互联网广告综述之点击率系统》论述了互联网广告的点击率系统,可以看到,其中的logistic regression模型是比较简单而且实用的,其训练方法虽然有多种,但目标是一致的,训练结果对效果的影响是比较大,但是训练方法本身,对效果的影响却不是决定性的,因为训练的是每个特征的权重,权重细微的差别不会引起ctr的巨大变化。在训练方法转载 2016-03-23 15:47:50 · 8995 阅读 · 0 评论 -
数据清洗与数据预处理浅析
本文根据https://zhuanlan.zhihu.com/p/20571505?refer=data-analyst-improvement 与自己的一些简单心得整理所得数据清洗与数据预处理在实际中非常重要。在整个项目的开发过程中,数据清洗与预处理的时间通常占到项目总时长的一半以上。而且,数据清洗与预处理的过程还是个极度考验体力与耐心的活,只有胆大细心对数据敏感对业务熟悉的人才能做好这项工作。链原创 2016-06-06 19:18:13 · 12995 阅读 · 0 评论 -
用户特征工程 超详细解读
在网上找到了美团一位叫付晴川同学些的ppt,里面有一幅描述用户特征工程的图,感觉总结得还是比较到位的。现在把图片贴出来: 这张图将用户特征工程里的大面基本都囊括了。因为ppt本身做得比较简单,现在我们试图针对图里的每一项,结合具体的业务场景,做个比较详细的分析。1.特征提取,或者说原始数据提取原作者画图的时候将第一项命名为特征提取,我觉得作者想表达的本意应该是从哪获得相关数据,所以叫原始数据提取可原创 2016-08-18 19:43:32 · 35935 阅读 · 1 评论