第四章 交叉结构
1 Factorized Machine(FM)
-
线性模型:p=b+∑i=1dwixip=b+\sum_{i=1}^dw_ix_ip=b+∑i=1dwixi
-
二阶交叉特征:p=b+∑i=1dwixi+∑i=1d∑j=i+1duijxixjp=b+\sum_{i=1}^dw_ix_i+\sum_{i=1}^d\sum_{j=i+1}^du_{ij}x_ix_jp=b+∑i=1dwixi+∑i=1d∑j=i+1duijxixj
- 模型有O(d2)O(d^2)O(d2)个参数
- 矩阵UUU表示所有uiju_{ij}uij的矩阵,令U≈VVTU\approx V{V^T}U≈VVT
-
Factorized Machine(FM):p=b+∑i=1dwixi+∑i=1d∑j=i+1d(viTvj)xixjp=b+\sum_{i=1}^dw_ix_i+\sum_{i=1}^d\sum_{j=i+1}^d(v_i^Tv_j)x_ix_jp=b+∑i=1dwixi+∑i=1d∑j=i+1d(viTvj)xixj
- 模型有O(kd)O(kd)O(kd)个参数(k<<dk<<dk<<d)
2 深度交叉网络(DCN)
2.1 交叉层(Cross Layer)
2.2 交叉网络(Cross Network)
2.3 深度交叉网络(Deep & Cross Network)
- 双塔模型的双塔、多目标模型中的Shared Bottom、MMoE中的专家模型
3 LHUC网络结构(精排)
LHUC起源于语音识别,快手将其应用在推荐精排,称为PPNet。
3.1 语音识别中的LHUC
- 神经网络的结果经过Sigmoid并乘2
3.2 推荐系统排序模型中的LHUC
- 将语音信号和说话者的特征分别替换为物品特征和用户特征
4 SENet & Bilinear Cross
4.1 SENet(Field-wise加权)
- Embedding向量维度可以不同
4.2 Field间特征交叉
- 特征交叉
- 内积
- Hadamard乘积
以上两种都要求特征维度相同
- Bilinear Cross
- 内积:fij=xiTWijxjf_{ij}=x_i^TW_{ij}x_jfij=xiTWijxj(mmm个fields对应m2/2m^2/2m2/2个参数矩阵,需要指定某些特征做交叉,而非全部)
- Hadamard乘积:fij=xi⊙(Wij⋅xj)f_{ij}=x_i\odot(W_{ij}\cdot x_j)fij=xi⊙(Wij⋅xj)
4.3 FiBiNet
全部)
- Hadamard乘积:fij=xi⊙(Wij⋅xj)f_{ij}=x_i\odot(W_{ij}\cdot x_j)fij=xi⊙(Wij⋅xj)