DGCF代码解读之重新出发

博主小明探讨DGCF模型在推荐召回中的应用,对比GCN和LightGCN的效果,指出数据量和模型参数对实际应用的影响。分享了代码理解和调优心得,强调理解并改造他人代码的重要性。同时提到序列模型GCE-GNN的挑战,以及模型在大规模数据下的优化问题。

hi我是小明哥,年少不知小明帅,为约妹子强说愁,哈哈。言归正传,每个新模型出来不到两个月,甚至不到一个月,就有人引用你的文章(你以为别人引用很开心,其实是人家为了踩你啊)马上与你的结果对比,效果就是比你的好,这种正常的竞争/竞赛我觉得很好,公平公正公开,不开源的就算了,谁知道有没有实现paper中宣称的结果,这种都是不足为信的。

总体来说,DGCF是CF协同过滤的大范畴之内的,当然要与最佳的模型对比了,目前来看最优的是GCN(LightGCN),这种方法如果维度小点能够达到相当不错的效果就好了,当数据量大时,比如百万用户,千万点击,这个模型参数必须减少(embedding size和n_layers),不然GPU/内存不够,又想模型好,又想覆盖全面,我说你是不是想多了,这种好事怕很难遇见吧(找对象不也是如此)。另外这个DGCF也是GNN方法的应用,与GCN方法是类似的(不同之处下次再说),而用到GNN的序列模型目前最好的是GCE-GNN,这个方法目前没有官方开源,第三方的codes笨菜鸟(就是我)还没实现(挺难的)。很多开源的新方法其实很难实际应用,1是数据量问题(空间内存都是问题),2是速度/时间问题,根本跑不起来,这方面的问题都很突出。一味地增加embedding size等参数使得效果变好会导致前面两个问题相当严重,结果只能退而求其次,降低后发现

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小李飞刀李寻欢

您的欣赏将是我奋斗路上的动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值