FM&FFM
特征类型
1.连续性特征:统计特征、用户对商品的偏好分、搜索词和文本相似度等
2.离散型特征:用户ID、性别、省份、商品ID、品牌ID、品类ID等
连续性特征离散化
1.连续性特征离散化优点:
离散化后的特征对异常数据有很强的鲁棒性
特征离散化后,模型会更稳定
2.连续性特征离散化的方法:
分桶法:等宽分桶、等频分桶
树模型分桶:借助树模型分桶
离散型特征:
one-hot编码:
hash trick
MF(Matrix Factorization)
min p , q L ( p , q ) = ∑ ( u , i ) ∈ K ( r u i − r ^ u i ) 2 + λ ( ∥ p u ∥ 2 + ∥ q i ∥ 2 ) \min _{p, q} L(p, q)=\sum_{(u, i) \in K}\left(r_{u i}-\hat{r}_{u i}\right)^{2}+\lambda\left(\left\|p_{u}\right\|^{2}+\left\|q_{i}\right\|^{2}\right) p,qminL(p,q)=(u,i)∈K∑(rui−r^ui)2+λ(∥pu∥2+∥