Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation (2020)

1. Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation (2020)

(0) 个人小结

本文提出了可以利用用户多种反馈行为(如:浏览、点击、加入购入车、购买等)且采用非采样进行训练的模型 EHCF ,该模型还考虑了用户行为之间的迁移关系,在训练时优化了loss的复杂度。

(1) 背景 & 问题描述

负采样容易受采样分布、采样数量的影响,导致其鲁棒性不高。非采样将用户所有没有交互过的数据作为负样本,这种做法覆盖面全,但是训练效率低。

(2) 研究方法

问题描述: 估计用户对某件商品做出某种行为(浏览、点击、加入购物车、购买等)的可能性。

模型框架图:

在这里插入图片描述

Embedding层: 输入的是用户的Embedding和该用户所有交互过的item的Embedding;

基于迁移的预测层: 引入了用户行为之间的迁移信息,如:用户先浏览,然后点击,接着加入购入车,最后购买;

在这里插入图片描述

多任务学习: 输出用户对某件物品各个行为的可能性

loss设计:

在这里插入图片描述

(3) 结论与展望

提出了EHCF模型,使用非采样的方法进行训练,并降低了训练的时间复杂度,同时使用了迁移的方法刻画用户各行为之间的先后顺序。

参考资料: 浅谈个性化推荐系统中的非采样学习

### 异构信息网络嵌入在推荐系统中的应用 #### 实现方法 异构信息网络(HIN)嵌入能够捕捉不同类型实体之间的复杂关系,从而提高推荐系统的性能。为了实现这一点,通常采用基于元路径的方法来构建和利用HIN。 1. **定义元路径** 元路径是指连接两个对象类型的特定序列,在HIN中可以用来表达不同种类的对象间的关系模式。例如,在电影数据库里,“User-Movie-Actor”就是一个有效的元路径[^1]。 2. **特征提取** 利用所选的元路径进行特征抽取,形成节点表示向量。此过程可以通过多种方式完成,比如随机游走、矩阵运算或者更先进的图神经网络(GNN)。对于每一对用户-物品组合,依据预设好的一组或多组元路径生成对应的特征向量作为输入给后续的学习模型。 3. **相似度计算** 基于上述获得的低维稠密向量表征,可运用余弦距离或其他合适的测度函数衡量任意两节点间的语义关联程度。这种量化后的亲疏关系有助于预测潜在的兴趣匹配情况,进而指导个性化推荐列表排序。 4. **训练与评估** 构造好样本集之后便能开展监督式或半监督式的机器学习任务了。常见的做法是以部分已知评分记录为正负例标签来进行分类器调参;而测试阶段则依赖交叉验证等手段确保泛化误差处于可控范围之内。 ```python import numpy as np from sklearn.metrics.pairwise import cosine_similarity def calculate_similarity(embeddings): """Calculate the similarity between all pairs of embeddings.""" sim_matrix = cosine_similarity(embeddings) return sim_matrix ``` #### 应用案例 在一个真实的社交平台场景下,假设存在大量用户的点赞行为构成了一张复杂的HIN。这里不仅包含了人与人的关注关系,还有他们共同参与的话题群组以及发表过的文章评论等内容。借助精心挑选的一系列有意义的元路径,如“Person-Paper-Author”,系统得以充分理解个体兴趣偏好并据此给出精准的内容推送建议。 另一个典型例子来自电子商务领域。商家希望根据顾客浏览历史及购买经历建立高效的营销策略。此时引入商品类别、品牌归属乃至评价反馈等多个维度的信息源组建起丰富的HIN框架,则可通过分析其中蕴含的价值链路帮助识别出那些最有可能促成交易转化的目标客户群体。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值