
推荐系统
Ezail_xdu
西安电子科技大学研究生在读。研究方向:机器学习/推荐系统/自然语言处理;
展开
-
推荐系统之UserCF
一: 推荐系统任务:联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者和信息生产中的双赢。长尾理论:传统80/20(%80销售额来自于20%热门商品)原则在互联网加入下受到挑战。长尾商品销售额是个不容小觑的数字,也许会超过热门商品带来的销售额。热门商品代表绝大多数用户需求,而长尾商品代表一小部分用户个性化需求。因此要发掘长尾...原创 2019-01-26 18:45:45 · 924 阅读 · 0 评论 -
《Deep Neural Networks for YouTube Recommendations》论文总结
最近继续总结之前读过的经典论文,正好看到知乎王喆老师提出的关于youtube的十大工程问题,研究之后发现自己第一遍阅读还是读的太粗陋,遂再次阅读,这里记下自己这几次阅读的一些思考与总结。总的来说youtube的推荐系统架构已经是如今各个互联网公司的基本操作了,十分具有纪念意义,那我我们来一起看看youtube的前辈们如果解决这个问题的。Youtube的用户推荐场景自不必多说,作为全球最大的UG...原创 2019-04-05 11:08:23 · 749 阅读 · 0 评论 -
推荐系统之冷启动
我们之前讨论推荐系统的UserCF算法和ItemCF等算法都是以拥有大量用户行为数据为先决条件,并以此对物品或者用户进行自动聚类。但是对于一个刚刚开始运行推荐系统的应用的网站来说,如何在没有大量用户行为数据的情况下设计个性化推荐系统并且让用户对推荐系统满意,从而愿意使用推荐系统,这就是冷启动问题。对于冷启动问题,一般分为三类: 一)用户冷启动:如何对新用户做个性化推荐。 二)物品冷启动...原创 2019-02-12 23:02:42 · 392 阅读 · 0 评论 -
推荐系统之基于图的模型
本博文将介绍PersonalRank算法,以及该算法在推荐系统上的应用。将用户行为数据用二分图表示,例如用户数据是由一系列的二元组组成,其中每个元组(u,i)表示用户u对物品i产生过行为。将个性化推荐放在二分图模型中,那么给用户u推荐物品任务可以转化为度量Uv和与Uv 没有边直接相连 的物品节点在图上的相关度,相关度越高的在推荐列表中越靠前。图中顶点的相关度主要取决与以下因素: ...原创 2019-02-12 15:47:41 · 1910 阅读 · 0 评论 -
《Wide & Deep Learning for Recommender Systems》论文总结
文章目录Wide & Deep Learning for Recommender Systems1.论文名词解释1.1 Memorization 和 Generalization1.2 Wide 和 Deep1.3 Cross-product transformation2. Wide & Deep Model2.1 推荐系统概览2.1.1 介绍2.1.2 LR2.1.3 Embe...原创 2019-02-11 23:42:11 · 1148 阅读 · 1 评论 -
推荐系统之LFM与邻域方法对比
LFM在topN推荐时,重要参数有四个:1.隐特征的个数F 2.学习率alpha 3.正则化参数lambda 4.正负样本比例ratio通过实验发现,ratio对算法性能影响最大(控制变量法)。随着负样本的增多,LFM的准确率和召回率有明显的提高,但是覆盖率不断降低,新颖度不断降低。在movielens数据集上的结果,可以发现LFM总是优于itemcf和usercf,但是LFM不适合稀疏的数据...原创 2019-02-10 15:16:35 · 1115 阅读 · 0 评论 -
推荐系统之LFM(隐语义模型)
最近在拜读项亮博士的《推荐系统实践》,系统的学习一下推荐系统的相关知识。今天学习了其中的隐语义模型在Top-N推荐中的应用,在此做一个总结。隐语义模型LFM和LSI,LDA,Topic Model其实都属于隐含语义分析技术,是一类概念,他们在本质上是相通的,都是找出潜在的主题或分类。这些技术一开始都是在文本挖掘领域中提出来的,近些年它们也被不断应用到其他领域中,并得到了不错的应用效果。比如,在推...原创 2019-01-28 00:02:51 · 1039 阅读 · 0 评论 -
推荐系统之itemCF
上一讲讲到userCF算法,该算法是根据用户之间相似度,来给目标用户推荐与他们相似用户产生过行为的物品。该算法在某些应用场景并不适用。首先随着网站用户数目越来越大,计算用户兴趣相似矩阵越来越困难,运算时间复杂度和空间复杂度和用户增长近似于平方关系。其次,基于用户的协同过滤很难对推荐结果作出解释。由此产生了基于物品的协同过滤(itemCF)给用户推荐和他们之前喜欢的物品相似的物品。不过ItemC...原创 2019-01-26 23:12:33 · 12680 阅读 · 2 评论 -
推荐系统之Cotent-Based算法
简单的内容关联算法算法的基本原理是将一个item的基本属性、内容、一级/二级类别标签等信息提取出来,抽成一个taglist,为每个tag赋一个权重。将所有item对应的taglist做一下倒排转换,放到倒排索引服务器中存储起来。当需要对某一个item做相关推荐的时候,将该item对应的taglist拿出来拼成一个类似搜索系统中的query表达式,再将召回的结果做一下排序作为推荐结果输出。当需要...原创 2019-01-31 12:52:16 · 455 阅读 · 0 评论 -
《Real-time Personalization using Embeddings for Search Ranking at Airbnb》论文总结
这次总结的文章是2018 kdd best paper,来自Airbnb的学长们。由于从去年年底到现在一直在百度feed实习,也接触到了大量的推荐业务,其实生成embedding更是家常便饭,今天这篇文章更是把embedding思想发挥到了极致。Airbnb作为全世界最大的短租网站,提供了一个连接房主(host)挂出的短租房(listing)和主要是以旅游为目的的租客(guest/user...原创 2019-04-24 17:33:45 · 545 阅读 · 0 评论