
个性化推荐
独自凌寒
这个作者很懒,什么都没留下…
展开
-
个性化推荐系统之用户画像研究笔记
构建推荐系统的核心任务之一:准确地分析用户的兴趣特点(用户画像) 什么是用户画像? 用户画像简单来说是从用户产生的各种数据中挖掘和抽取用户在不同属性上的标签,如年龄、性别、职业、收入、兴趣等。完备且准确的属性标签将有力的揭示用户本质特征,因而极大地促进精准的个性化推荐。 用户画像研究概况: 目前,主流用户画像方法一般是基于机器学习尤其是有监督学习的技术。这类方...原创 2019-11-01 13:48:03 · 873 阅读 · 0 评论 -
请聊聊你所了解的推荐系统算法
推荐系统算法如果根据推荐的依据进行划分,有如下三大类算法:一、Content-based recommenders:推荐和用户喜欢的商品相似的商品。主要是基于商品属性信息和用户画像信息的对比。核心问题是如何刻画啊商品属性和用户画像以及效用的度量。方法包括:1.1 Heuristic-based method:对于特征维度的构建,例如基于关键字提取的方法,使用IF-IDF等指标提取关键字作为...原创 2019-10-21 21:36:55 · 462 阅读 · 0 评论 -
怎么解决推荐系统中的冷启动问题
1、冷启动问题定义推荐系统需要根据用户的历史行为和兴趣预测用户未来的行为和兴趣,对于BAT这类大公司来说,它们已经积累了大量的用户数据,不发愁。但是对于很多做纯粹推荐系统的网站或者很多在开始阶段就希望有个性化推荐应用的网站来说,如何对用户一无所知(即没有用户行为数据)的情况下进行最有效的推荐呢?这就衍生了冷启动问题。2.冷启动的分类冷启动问题主要分为3类:用户冷启动,即如何给...原创 2019-10-21 09:55:11 · 785 阅读 · 0 评论 -
推荐系统中使用CTR排序的f(x)的设计-传统模型篇
一.什么是ctr?ctr即点击率,在推荐系统中,通常是按照ctr来召回的内容子集进行排序,然后再结合策略进行内容的分发。二.ctr预估模型的发展ctr预估模型的公式:y=f(x),y的范围为[0, 1],表示广告被点击的概率。1.LR海量高维离散特征LR(logistics regression),是ctr预估模型的最基本的模型。也是工业界最喜爱使用的方案。LR的介绍这里就不细...原创 2019-10-15 14:18:24 · 386 阅读 · 0 评论 -
CTR预估中GBDT与LR融合方案
1、背景 CTR预估(Click-Through Rate Prediction)是互联网计算广告中的关键环节,预估准确性直接影响公司广告收入。CTR预估中用的最多的模型是LR(Logistic Regression)[1],LR是广义线性模型,与传统线性模型相比,LR使用了Logit变换将函数值映射到0~1区间[2],映射后的函数值就是CTR的预估值。LR这种线性模型很容易并行...原创 2019-10-14 10:28:21 · 150 阅读 · 0 评论 -
矩阵分解推荐算法
作者在《协同过滤推荐算法》这篇文章中介绍了user-based和item-based协同过滤算法,这类协同过滤算法是基于邻域的算法(也称为基于内存的协同过滤算法),该算法不需要模型训练,基于非常朴素的思想就可以为用户生成推荐结果。还有一类基于隐因子(模型)的协同过滤算法也非常重要,这类算法中最重要的代表就是本节我们要讲的矩阵分解算法。矩阵分解算法是2006年Netflix推荐大赛获奖的核心算法,在...原创 2019-09-24 10:28:51 · 591 阅读 · 0 评论 -
推荐系统之CTR预估-FM算法解析
一、问题由来 在计算广告和推荐系统中,CTR预估(click-through rate)是非常重要的一个环节,判断一个商品是否进行推荐需要根据CTR预估的点击率来进行。传统的逻辑回归模型是一个广义线性模型,非常容易实现大规模实时并行处理,因此在工业界获得了广泛应用,但是线性模型的学习能力有限,不能捕获高阶特征(非线性信息),而在进行CTR预估时,除了单特征外,往往要对特征进行组合。对...原创 2019-09-19 10:16:42 · 436 阅读 · 0 评论 -
学习排序 Learning to Rank:从pointwise和pairwise到listwise,经典模型与优缺点
Ranking是信息检索领域的基本问题,也是搜索引擎背后的重要组成模块。本文将对结合机器学习的ranking技术——learning2rank——做个系统整理,包括pointwise、pairwise、listwise三大类型,它们的经典模型,解决了什么问题,仍存在什么缺陷。关于一些扩展话题和具体应用,可能会在下一篇文章介绍,包括在QA领域的实践情况。 本文主要参考刘铁...原创 2019-09-22 17:26:33 · 2522 阅读 · 1 评论 -
Learning to Rank简介
本文将对L2R做一个比较深入的介绍,主要参考了刘铁岩、李航等人的几篇相关文献[1,2,3],我们将围绕以下几点来介绍L2R:现有的排序模型,为什么需要使用机器学习的方法来进行排序,L2R特征的选取,L2R训练数据的获取,L2R训练和测试,L2R算法分类和简介,L2R效果评价等。1.现有的排序模型 排序(Ranking)一直是信息检索的核心研究问题,有大量的成熟的方法,主要...原创 2019-09-21 11:03:07 · 197 阅读 · 0 评论 -
广告点击率模型中,LR,GBDT+LR,FM,DNN等模型的优点和缺点?实际效果如何?
LR优点:1.是一个很好的baseline,效果不错,当然因为效果不错,所以后续的版本想超过它,真的还是很难的。2.实际简单,有开源的工具可以直接用来训练,在线的代码也写起来比较容易。缺点:1.因为是线性模型,所以有选择交叉特征的工作,这部分工作消耗大量的精力,但往往没什么效果。一般都是wrapper方法选择,每轮可能都要进行小时级的运算,理论上要进行2^n轮(n是特征数),但...原创 2019-08-10 16:00:41 · 1711 阅读 · 0 评论 -
矩阵分解(MATRIX FACTORIZATION)在推荐系统中的应用
前言最近一段时间隐语义模型(Latent Factor Model,LFM)在推荐系统中的应用越来越广泛,本文所介绍的矩阵分解方法也是基于这个隐语义模型。这里需要说明的一点是,这里所说的矩阵分解并不是SVD,之前在这个问题纠结了很久,因为网上很多人还有周围的人都把矩阵分解就当成了SVD,实际上SVD也是矩阵分解的一种技术(SVD在推荐系统中的应用见http://blog.youkuaiyun.com/...原创 2019-02-22 15:35:51 · 630 阅读 · 0 评论 -
基于用户的协同过滤推荐-实现电影推荐
1.协同过滤 协同过滤(Collaborative Filtering)字面上的解释就是在别人的帮助下来过滤筛选,协同过滤一般是在海量的用户中发现一小部分和你品味比较相近的,在协同过滤中,这些用户称为邻居,然后根据他们喜欢的东西组织成一个排序的目录来推荐给你。问题的重点就是怎样去寻找和你比较相似的用户,怎么将那些邻居的喜好组织成一个排序的目录给你,要实现一个协同过滤的系统,需要以下几个步骤:...原创 2019-02-22 14:40:36 · 1766 阅读 · 1 评论 -
(一)基于用户的协同过滤推荐算法原理和实现
在推荐系统众多方法中,基于用户的协同过滤推荐算法是最早诞生的,原理也较为简单。该算法1992年提出并用于邮件过滤系统,两年后1994年被 GroupLens 用于新闻过滤。一直到2000年,该算法都是推荐系统领域最著名的算法。 本文简单介绍基于用户的协同过滤算法思想以及原理,最后基于该算法实现园友的推荐,即根据你关注的人,为你推荐博客园中其他你有可能感兴趣的人。 基本思想 ...原创 2019-02-22 09:42:03 · 3029 阅读 · 0 评论