2.app recommendation with very sparse datasets

针对App商店推荐系统的局限性,提出了一种新的特征App模型(eigenapp model),该模型旨在改善热门应用的偏斜现象,并提升长尾应用的推荐效果。通过对GetJar数据集的分析,该模型相较于传统的基于记忆和隐语义模型,在准确度、长尾应用推荐及多样性方面表现更佳。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.摘要

app的使用曲线呈现很高的峰态和更显著的长尾现象。即,少数最受欢迎的的app享有很高的下载量,绝大多数app所占份额极少,甚至屈指可数,具有很大的稀疏性。

主要原因有:与电影等商品相比,app开发者使用的资源具有很大的多样性且发布app的开支更小。

对稀疏集的处理,可提高降维的使用。


2.我的想法

现有的app商店多数使用以下三种方法提供app:(1)最受欢迎的app列表(2)几大类别分类呈现(3)关键字搜索。

存在问题:(1)极少数app因受欢迎而更受欢迎,埋没新生高质量app市场;(2)类别分类太粗糙,通常一个类别下包含超多条目;(3)用户并不知道要搜索什么。搜索的通常是标题。


3.结论

传统基于记忆的算法(memory-based)对少数受欢迎的app更有利,会造成更严重的峰态;
隐语义模型(latent factor model)更适合对电影等商品的处理,对稀疏集的处理准确性不足;
本文所提出的eigenapp model 对于具有稀疏性的长尾app具有优越的推荐效果。


4.数据处理

(1)数据集
使用GetJar上2011年11月7日-11月21日,101106个用户,55020个app的记录。

(2)数据预处理。
峰态和长尾现象明显,定义最受欢迎的100个app作为头部。可能存在同一app功能类似,多次发布。数据集中清除不足20个用户的app数据。

(3)衡量指标设置。
选取使用的天数作为衡量指标。因为对app的评分受上下文影响较大,而且,对于不同类别app,使用的多不一定评分高。
为了说明更合理,采取两种评测系统:1)使用的天数;2)使用和未使用二值。

5.模型设计

(1)非个性化模型
根据受欢迎度进行排序,受欢迎度通过用户数衡量。

(2)基于记忆的模型
通过对数据的分析发现超过90%的app对只有一个或没有共同用户。由于皮尔逊相关系数(Pearson correlation coefficient)需要大量共同用户,所以选择余弦相似度。
用R表示m*n用户-app矩阵,根据计算得item-item相似度矩阵S,可想而知S较为稀疏。考虑用计算亲密度,I_u表示用户u使用的app集合,根据亲密度评分来生成top-N列表。发现用Z评分对S_i,j进行正规化后效果更好,。同时能减少噪声。

(3)隐语义模型
对于之前构建的R矩阵,利用PureSVD进行因子分解。PureSVD不盲目追求RMSE(均方根误差)最优,而是根据相关评分相对排序(什么鬼?)。

(4)特征app模型(eigenapp model)
对矩阵R的item向量进行正规化,防止倾向于热门app。采用PCA(主成分分析)提取特征。
各种投影,转置提取出较好的特征。


6.评测

评测指标:准确度;长尾app的准确度;流行度;多样性。

资源下载链接为: https://pan.quark.cn/s/22ca96b7bd39 在当今的软件开发领域,自动化构建与发布是提升开发效率和项目质量的关键环节。Jenkins Pipeline作为一种强大的自动化工具,能够有效助力Java项目的快速构建、测试及部署。本文将详细介绍如何利用Jenkins Pipeline实现Java项目的自动化构建与发布。 Jenkins Pipeline简介 Jenkins Pipeline是运行在Jenkins上的一套工作流框架,它将原本分散在单个或多个节点上独立运行的任务串联起来,实现复杂流程的编排与可视化。它是Jenkins 2.X的核心特性之一,推动了Jenkins从持续集成(CI)向持续交付(CD)及DevOps的转变。 创建Pipeline项目 要使用Jenkins Pipeline自动化构建发布Java项目,首先需要创建Pipeline项目。具体步骤如下: 登录Jenkins,点击“新建项”,选择“Pipeline”。 输入项目名称和描述,点击“确定”。 在Pipeline脚本中定义项目字典、发版脚本和预发布脚本。 编写Pipeline脚本 Pipeline脚本是Jenkins Pipeline的核心,用于定义自动化构建和发布的流程。以下是一个简单的Pipeline脚本示例: 在上述脚本中,定义了四个阶段:Checkout、Build、Push package和Deploy/Rollback。每个阶段都可以根据实际需求进行配置和调整。 通过Jenkins Pipeline自动化构建发布Java项目,可以显著提升开发效率和项目质量。借助Pipeline,我们能够轻松实现自动化构建、测试和部署,从而提高项目的整体质量和可靠性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值