IS论文分享Longitudinal Impact of Preference Biases on Recommender Systems’ Performance

        《Longitudinal Impact of Preference Biases on Recommender Systems’ Performance》,由Meizi Zhou、Jingjing Zhang和Gediminas Adomavicius撰写,发表在《信息系统研究》(Information Systems Research)期刊上。文章通过模拟方法研究了偏好偏差对推荐系统性能的纵向影响,探讨了偏好偏差的大小对系统预测性能以及用户消费结果的影响,并提出了减少偏好偏差的方法。

研究背景
        推荐系统(RS)在电子商务、流媒体等在线服务中广泛应用,帮助用户发现符合其兴趣和需求的项目,同时帮助服务提供商提高销售额和用户留存率。用户与推荐系统的交互形成反馈回路,包括预消费和后消费两个阶段。预消费阶段,系统提供推荐帮助用户选择项目;后消费阶段,用户对已消费项目进行反馈,常见方式是显式数值评分。这些反馈数据被系统用于调整和改进后续推荐。

        现有研究表明,推荐系统展示的推荐会影响用户的后消费偏好评级,这种偏好偏差在不同领域和推荐类型中普遍存在。然而,以往研究多在静态环境中评估偏差,而现实中的推荐系统是动态迭代的,可能放大偏差的长期影响。本文通过模拟方法研究偏好偏差对推荐系统性能的纵向影响。

研究方法
        研究使用基于代理的模拟框架,分析偏好偏差的纵向动态。模拟环境允许有针对性地操纵和控制不同因素,如平台类型、用户群体、项目群体、推荐算法等。模拟过程包括系统初始化、用户消费选择、用户后消费反馈和系统更新等步骤。

系统初始化
        使用潜在特征向量建模项目和用户群体,项目内容和用户偏好表示为K维连续潜在特征向量。通过矩阵分解模型从真实世界评分中提取潜在项目特征和用户偏好,初始化用户和项目的潜在特征向量,用于计算用户对项目的实际偏好评分。

用户消费选择
        用户根据推荐列表选择项目,选择概率取决于项目在列表中的排名,使用指数衰减函数建模。用户消费频率通过消费周期建模,表示用户连续两次消费的平均时间间隔。

用户后消费反馈
        用户对已消费项目提供反馈评分,评分受偏好偏差影响,提交的评分是用户真实偏好评分和系统显示评分的线性组合,偏差程度从0到1变化。

模拟假设
        模拟是现实世界环境的简化版本,做出若干假设:用户最多消费和评分一次;无金钱因素;项目无库存限制;所有用户推荐由同一系统生成;用户偏好在短期内稳定;聚焦于经典推荐算法背景下的偏好偏差。

实验设计
        实验使用两个公开数据集:Netflix 100M数据集的子集和Yelp评分数据的子集。比较了多种推荐技术的纵向性能动态,包括基于项目的最近邻方法(ItemKNN)、基于SVD的矩阵分解方法和基于自动编码器的深度学习方法(I-AutoRec)。

实验结果
实验1:不同偏差程度的纵向动态

        研究发现,偏好偏差显著损害推荐系统的预测性能和用户的消费结果。随着偏差从0增加到1,系统的预测准确性(RMSE)改善减小,当偏差接近1时,RMSE甚至随时间增加。消费相关性在偏差从0到0.8时变化不大,但当偏差进一步增加到1时,相关性显著下降。消费多样性随时间改善,但与偏差程度负相关,偏差越大,多样性增长越小。

        分析表明,偏好偏差通过评分膨胀机制影响系统性能。高偏差导致消费项目的评分膨胀加速,这些膨胀的评分被添加到系统训练数据中,削弱系统学习用户真实偏好的能力。不受欢迎和内容相似度高的项目更容易积累评分膨胀,因为它们的初始评分较少,少量膨胀评分即可显著提高其平均评分,进而影响系统预测。

实验2:异质用户群体
        研究探讨了具有不同偏好偏差程度的异质用户群体对系统性能的影响。结果表明,当用户群体中存在偏差用户时,即使只有一半用户有高偏差,系统的整体准确性和多样性介于同质偏差群体之间,但消费相关性接近无偏差群体。进一步分析发现,偏差用户和无偏差用户之间存在溢出效应,偏差用户的反馈会影响无偏差用户的推荐,反之亦然。

实验3:事后评分去偏差
        研究评估了两种去偏差方法:全局去偏差和个体去偏差。全局去偏差基于整个用户群体的平均偏差水平,个体去偏差基于每个用户的偏差水平。结果表明,与仅使用历史评分数据的去偏差方法(如HIALF)相比,这两种方法显著提高了预测准确性,尤其是个体去偏差方法。去偏差后的评分能更好地恢复系统的预测性能和消费多样性。

结论
        研究通过模拟实验揭示了偏好偏差对推荐系统性能的显著纵向影响。高偏好偏差导致系统预测准确性、相关性和多样性降低,且影响随偏差大小非线性增加。不受欢迎和内容相似度高的项目更容易受偏好偏差影响。异质用户群体中,偏差用户和无偏差用户之间存在溢出效应。研究提出的去偏差方法能有效减轻偏好偏差的影响,提高系统性能。

实际意义
        研究结果对推荐系统的设计具有重要实际意义,强调了减少用户评分中偏好偏差的必要性。推荐平台可通过获取用户暴露于推荐信息的记录和估计用户群体的偏差水平,采用全局或个体去偏差方法处理用户提交的评分,从而提高系统的预测准确性和用户的消费体验。

如果你觉得这篇博文对你有帮助,请点赞、收藏、关注我,并且可以打赏支持我!

欢迎关注我的后续博文,我将分享更多关于人工智能、自然语言处理和计算机视觉的精彩内容。

谢谢大家的支持!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

会飞的Anthony

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值