MSDMT使用多源数据和多任务学习预测用户流失和付费

导读

对于用户流失和付费预测任务,MSDMT模型创造性地引入玩家画像、行为序列和社交网络在内的异构多源数据,取得显著的改进。特此将MSDMT论文全文翻译,总共8971字,以供大家参考和学习。

摘要

对游戏玩家进行分析,尤其是潜在的流失和付费预测,对于在线游戏来说至关重要,这有助于改进产品设计和增加收入。然而,目前的解决方案要么将流失预测视为一个独立任务,要么将付费预测视为一个独立任务,而且大多数之前的尝试只依赖于单一的数据源,即表格形式的玩家画像数据。

基于两款现实世界的在线游戏的数据,我们进行了广泛的数据分析。一方面,玩家流失和付费之间存在显著的相关性。另一方面,包括玩家画像、行为序列和社交网络在内的异构多源数据可以相互补充,更好地理解每个玩家。为此,我们提出了一种新颖的多源数据多任务学习方法,名为MSDMT,以捕获多源隐含信息,并以多任务学习的方式同时预测每个玩家的流失和付费。在两个游戏数据集上的全面实验验证了我们提出方法的有效性和合理性,与其它基线方法相比取得了显著的改进。

1. 引言

游戏行业正在蓬勃发展,持续稳定的收入超过1510亿美元,已经成为一个有希望的综合市场,不仅仅是娱乐业务。随着游戏技术的广泛普及,网络游戏获得了非常广泛的受众,并且受到所有年龄段玩家的喜爱。作为在线游戏的关键组成部分,玩家画像已经吸引了学术界和工业界的越来越多的关注。大多数在线游戏都部署了以玩家画像为中心的各种平台和服务。

玩家画像的目的是了解玩家是谁以及他们将做什么,特别是他们是否会退出游戏,即流失,以及他们将付费多少,即付费。玩家流失率在很大程度上决定了在线游戏的生命周期,而潜在的付费能力可以衡量每个游戏的利润。结合流失和付费预测,游戏分析师可以预测每个玩家的生命周期价值(LTV)和整个游戏的总收入。已经开发了一系列方法来预测流失或付费。通常,流失预测被建模为分类任务,而付费预测可以被视为回归问题。统计预测方法,例如逻辑回归、基于树的模型,通常依赖于精细的特征工程,而神经网络模型,例如多层感知器(MLP)、长短期记忆(LSTM),则试图探索大规模数据中隐含的相关性。

尽管取得了令人印象深刻的进展,但目前的解决方案无法充分利用玩家流失和付费之间的相关性以及异构多源数据之间的互补性。

图片

如图1所示,在线游戏中的各种游戏玩法和设置为描述每个玩家提供了多种异构数据源:

  • 从玩家行为记录统计生成的玩家画像;

  • 每个玩家的每个游戏内行为的行为序列;

  • 由玩家之间的关系形成的社交网络。

玩家画像和行为序列分别代表玩家的静态和动态个人喜好。此外,玩家行为通常受到与他们有关系的其他人的影响,因为群体相互互动并共享类似的事件流,特别是在常规的时间、地点或关系。然而,大多数先前的方法主要关注表格形式的玩家画像,很少考虑行为序列和社交网络带来的互补信息。例如,行为序列中的潜在模式和社交网络的群体效应可以从不同的角度对玩家进行画像,并相互补充。

此外,文献中大多数现有的方法尝试将玩家流失或玩家付费预测作为两个独立的任务。直观地说,每个玩家的生命周期价值(LTV)基本上取决于玩家将玩多久以及玩家将付费多少,因此同时考虑流失和付费是非常合理的。实证分析(见第四部分)表明,这两项任务之间存在显著的相关性,例如,一个玩家如果不想玩游戏,就非常不可能进行付费。当前的单任务解决方案无法捕捉玩家流失和付费之间的相关性,以便更好地对玩家进行画像。总之,我们缺乏一种有效的方法,能够充分利用多源异构数据同时处理付费者流失和付费预测任务。

为了解决这些问题,我们提出了一种新颖的多源数据多任务学习方法,名为MSDMT,用于在线游戏中玩家流失和付费预测的玩家画像。具体来说,我们基于玩家画像数据、行为序列数据和社交网络数据构建了三个模块,以从三个不同的角度捕获丰富的隐含信息。我们使用LSTM来模拟日常聚合玩家画像中的动态。考虑到潜在时间信息的影响,我们利用层次化的卷积神经网络-长短期记忆网络(CNN-LSTM)来利用玩家的短期和长期行为偏好。结合玩家画像和行为序列的表示,我们可以构建每个玩家的个人偏好,并获取社交网络图中的节点特征。采用图卷积网络(GCN)挖掘玩家之间的群体偏好,我们还使用多任务学习框架优化了玩家流失和付费预测任务。主要贡献总结如下:

  • 通过广泛的实证观察和分析,我们发现了玩家流失和付费之间显著的相关性,以及各种异构数据源之间的差异和互补性。

  • 受关键发现的启发,我们提出了一个三模块框架,以多任务学习的方式处理多源数据并做出最终预测。

  • 我们在两个现实世界的数据集上进行了全面的实验,以验证我们提出的MSDMT的有效性和合理性。

2. 相关工作

2.1 游戏中的玩家画像分析

对游戏玩家在其生命周期内的画像分析和建模是一个广泛关注的问题。玩家在不同的生命周期阶段有不同的需求。因此,收集和管理玩家生命周期的数据将有助

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值