首先阐述FM的核心思想:
基于对实对称矩阵的理解,信息的二阶特征Xi和Xj用隐向量的内积表示为:<Vi, Vj>,这里他们是n*k的矩阵,参数量大大降低,也只需要维护Vi一个矩阵即可,本质上Vi和Vj只是转置的关系。
推导公式如下:
公式的不难理解,参考下面的步骤:
【step1】计算说明如下:FM二阶项计算的是下面所有黄色正方形相加之和
纠正:第四步骤中,应该从i=1开始,公式错误
二阶特征交叉的源码如下:
# sum-square-part
self.summed_features_emb = tf.reduce_sum(self.embeddings, 1) # None * k (batch_size, embedding_size) 计算每个样本所有特征嵌入向量的和
self.summed_features_emb_square = tf.square(self.summed_features_emb) # None * K
# squre-sum-part
self.squared_features_emb = tf.square(self.embeddings)
self.squared_sum_features_emb = tf.reduce_sum(self.squared_features_emb, 1) # None * K
#second order
self.y_second_order = 0.5 * tf.subtract(self.summed_features_emb_square, self.squared_sum_features_emb)
self.y_second_order = tf.nn.dropout(self.y_second_order, self.dropout_keep_fm[1])
代码的理解用笔记的形式写出来: