DGCF代码解读之重新出发

最新推荐文章于 2024-11-05 19:55:40 发布

原创最新推荐文章于 2024-11-05 19:55:40 发布 · 3.8k 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#DGCF #推荐召回

NLP与推荐算法专栏收录该内容

155 篇文章 ¥399.90 ¥499.90

订阅专栏

超级会员免费看

博主小明探讨DGCF模型在推荐召回中的应用，对比GCN和LightGCN的效果，指出数据量和模型参数对实际应用的影响。分享了代码理解和调优心得，强调理解并改造他人代码的重要性。同时提到序列模型GCE-GNN的挑战，以及模型在大规模数据下的优化问题。

hi我是小明哥，年少不知小明帅，为约妹子强说愁，哈哈。言归正传，每个新模型出来不到两个月，甚至不到一个月，就有人引用你的文章（你以为别人引用很开心，其实是人家为了踩你啊）马上与你的结果对比，效果就是比你的好，这种正常的竞争/竞赛我觉得很好，公平公正公开，不开源的就算了，谁知道有没有实现paper中宣称的结果，这种都是不足为信的。

总体来说，DGCF是CF协同过滤的大范畴之内的，当然要与最佳的模型对比了，目前来看最优的是GCN（LightGCN），这种方法如果维度小点能够达到相当不错的效果就好了，当数据量大时，比如百万用户，千万点击，这个模型参数必须减少(embedding size和n_layers)，不然GPU/内存不够，又想模型好，又想覆盖全面，我说你是不是想多了，这种好事怕很难遇见吧（找对象不也是如此）。另外这个DGCF也是GNN方法的应用，与GCN方法是类似的（不同之处下次再说），而用到GNN的序列模型目前最好的是GCE-GNN，这个方法目前没有官方开源，第三方的codes笨菜鸟（就是我）还没实现（挺难的）。很多开源的新方法其实很难实际应用，1是数据量问题（空间内存都是问题），2是速度/时间问题，根本跑不起来，这方面的问题都很突出。一味地增加embedding size等参数使得效果变好会导致前面两个问题相当严重，结果只能退而求其次，降低后发现