hi我是小明哥,年少不知小明帅,为约妹子强说愁,哈哈。言归正传,每个新模型出来不到两个月,甚至不到一个月,就有人引用你的文章(你以为别人引用很开心,其实是人家为了踩你啊)马上与你的结果对比,效果就是比你的好,这种正常的竞争/竞赛我觉得很好,公平公正公开,不开源的就算了,谁知道有没有实现paper中宣称的结果,这种都是不足为信的。
总体来说,DGCF是CF协同过滤的大范畴之内的,当然要与最佳的模型对比了,目前来看最优的是GCN(LightGCN),这种方法如果维度小点能够达到相当不错的效果就好了,当数据量大时,比如百万用户,千万点击,这个模型参数必须减少(embedding size和n_layers),不然GPU/内存不够,又想模型好,又想覆盖全面,我说你是不是想多了,这种好事怕很难遇见吧(找对象不也是如此)。另外这个DGCF也是GNN方法的应用,与GCN方法是类似的(不同之处下次再说),而用到GNN的序列模型目前最好的是GCE-GNN,这个方法目前没有官方开源,第三方的codes笨菜鸟(就是我)还没实现(挺难的)。很多开源的新方法其实很难实际应用,1是数据量问题(空间内存都是问题),2是速度/时间问题,根本跑不起来,这方面的问题都很突出。一味地增加embedding size等参数使得效果变好会导致前面两个问题相当严重,结果只能退而求其次,降低后发现
博主小明探讨DGCF模型在推荐召回中的应用,对比GCN和LightGCN的效果,指出数据量和模型参数对实际应用的影响。分享了代码理解和调优心得,强调理解并改造他人代码的重要性。同时提到序列模型GCE-GNN的挑战,以及模型在大规模数据下的优化问题。
订阅专栏 解锁全文
1868

被折叠的 条评论
为什么被折叠?



