判断一个商品的是否进行推荐需要根据CTR预估的点击率来进行。
在进行CTR预估时,除了单特征外,往往要对特征进行组合。对于特征组合来说,通用的做法主要有两大类:FM系列与Tree系列。
今天,我们就来讲讲FM算法。FM(Factorization Machine)主要是为了解决数据稀疏的情况下,特征怎样组合的问题。

country,day,ad_type则是对应的特征。对于这种categorical特征,一般都是进行one-hot编码处理。one-hot编码带来的另一个问题是特征空间变大

本文探讨了在数据稀疏情况下如何有效进行特征组合以提高CTR预估的准确性,重点介绍了Factorization Machine(FM)算法及其在解决特征组合问题上的应用。
判断一个商品的是否进行推荐需要根据CTR预估的点击率来进行。
在进行CTR预估时,除了单特征外,往往要对特征进行组合。对于特征组合来说,通用的做法主要有两大类:FM系列与Tree系列。
今天,我们就来讲讲FM算法。FM(Factorization Machine)主要是为了解决数据稀疏的情况下,特征怎样组合的问题。

country,day,ad_type则是对应的特征。对于这种categorical特征,一般都是进行one-hot编码处理。one-hot编码带来的另一个问题是特征空间变大

转载于:https://www.cnblogs.com/pocahontas/p/11399003.html
9097
1609
5567

被折叠的 条评论
为什么被折叠?