
推荐算法
文章平均质量分 78
Danni_hgc
这个作者很懒,什么都没留下…
展开
-
阿里推荐算法:BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from Transform
阿里推荐算法:BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from Transformer注意:1.bert用在推荐系统中,将用户的历史序列看做是词序列。2.测试时,将序列的最后一个item进行maskedAbstract:根据用户历史的行为信息,对用户动态的偏好衍变进行建模,是对推荐系统产生的巨大挑战。现有算法使用序列神经网络,只能从左向右,利用单向信息进行建模。尽管这些放大得到了很转载 2021-10-04 20:30:20 · 1344 阅读 · 0 评论 -
阿里手淘猜你喜欢Swing算法介绍
**.阿里手淘猜你喜欢Swing算法介绍**Swing算法原理比较简单,是阿里早期使用到的一种召回算法,在阿里多个业务被验证过非常有效的一种召回方式,它认为 user-item-user 的结构比 itemCF 的单边结构更稳定。Swing指的是秋千,例如用户 u uu 和用户 v vv ,都购买过同一件商品i ii,则三者之间会构成一个类似秋千的关系图。若用户 u 和用户 v 之间除了购买过 i 外,还购买过商品 j ,则认为两件商品是具有某种程度上的相似的。也就是说,商品与商品之间的相似关系转载 2021-08-22 11:18:33 · 1336 阅读 · 0 评论 -
怎么理解倒排索引
渣翻译的例子之一。英文原名Inverted index,大概因为 Invert 有颠倒的意思,就被翻译成了倒排。但是倒排这个名称很容易让人理解为从A-Z颠倒成Z-A。个人认为翻译成转置索引可能比较合适。一个未经处理的数据库中,一般是以文档ID作为索引,以文档内容作为记录。而Inverted index 指的是将单词或记录作为索引,将文档ID作为记录,这样便可以方便地通过单词或记录查找到其所在的文档...转载 2018-04-09 22:25:07 · 935 阅读 · 0 评论 -
Google News Personalization: Scalable Online Collaborative Filtering里 LSH详解
从文档相似度计算看LSH(Locality Sensitive Hashing) Minhash衡量两个用户之间的相似度可以用他们的交集来表示,也被称为Jaccard 相似度 用户uj看过的新闻对于用户ui来说有s(ui,uj)的吸引力。在计算的时候,可以使用LSH来缩减数据规模,其中LSH的思想就是相近的数据在哈希过程中更有可能产生冲突,具体解释如下:我们来看一个寻找相似文档问题,给...转载 2018-03-08 17:25:28 · 823 阅读 · 0 评论 -
推荐算法有两种准确度评价指标:
1、预测准确度:比如MAE,RMSE2、分类准确度:分类准确度定义为推荐算法对一个产品用户是否喜欢判定正确的比例。因此 ,当用户只有二元选择时 ,用分类准确度进行评价较为合适。因此,想要用准确率和召回率评价推荐算法,必须将评分分为两部分,高于某个评分,表示喜欢,低于这个评分,表示不喜欢。准确率和召回率: 准确率定义为系统的推荐列表中用户喜欢的产品和所有被推荐产品的比率:,准确...转载 2018-02-11 13:58:58 · 2096 阅读 · 0 评论 -
推荐算法有两种准确度评价指标:
1、预测准确度:比如MAE,RMSE2、分类准确度:分类准确度定义为推荐算法对一个产品用户是否喜欢判定正确的比例。因此 ,当用户只有二元选择时 ,用分类准确度进行评价较为合适。因此,想要用准确率和召回率评价推荐算法,必须将评分分为两部分,高于某个评分,表示喜欢,低于这个评分,表示不喜欢。准确率和召回率: 准确率定义为系统的推荐列表中用户喜欢的产品和所有被推荐产品的比率:,准确转载 2018-01-10 16:01:35 · 11772 阅读 · 0 评论 -
举例讲解协同过滤中相似度的计算方式
协同过滤中相似度的计算很有技巧性,下面对比几种计算的方式。假设输入的Item-User矩阵为:设用户共有M个,Item共有N个,在本例子中,M=3,N=4M=3,N=4。矩阵中为空的元素代表对应的用户对Item没有行为,也可以认为该用户对该Item的评分为0.一、用二维数组依次计算这种方式的实现步骤如下:1、遍历User,依次取出U1,U2,U3U1,U2,U3。当取到U1转载 2018-01-05 10:42:05 · 7125 阅读 · 0 评论 -
举例理解推荐算法GBDT
GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案。它在被提出之初就和SVM一起被认为是泛化能力(generalization)较强的算法。近些年更因为被用于搜索排序的机器学习模型而引起大家关注。举个年龄预测问题原创 2017-12-27 16:56:27 · 5288 阅读 · 0 评论 -
电影推荐算法实例代码
```# -*- coding=utf-8 -*-import mathimport sysfrom texttable import Texttable## 使用 |A&B|/sqrt(|A || B |)计算余弦距离###def calcCosDistSpe(user1,user2): avg_x=0.0 avg_y=0.0 for key in u原创 2017-12-27 16:31:31 · 4810 阅读 · 7 评论 -
协同过滤推荐算法实例代码
什么是协同过滤 协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤 (Collaborative Filtering, 简称 CF),首先想一个简单的问题,如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?大部分的人会问问周围的朋友,看看最近有什么好看的电影推荐,而我们一般更倾向于从口味比较类似的朋友那里得到推荐。这就是协同过滤的核心思想。换句话说,就是借鉴和你相关人群的观点来进行推转载 2017-12-27 11:34:21 · 16726 阅读 · 5 评论 -
什么是推荐算法和主要方法
在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法。标题 ##1. 什么是推荐算法推荐算法最早在1992年就提出来了,但是火起来实际上是最近这些年的事情,因为互联网的爆发,有了更大的数据量可以供我们使用,推荐算法才有了很大的用武之地。最开始,所以我们在网上找资料,都是进yahoo,然后分门别类的点进去,找到你想要的东西,这是一个人工过程,到后来,我们用google,直接搜索原创 2017-12-27 11:16:15 · 5448 阅读 · 0 评论 -
什么是CVR,CTR,CPC,CPA,ROI?
CVR (Click Value Rate): 转化率,衡量CPA广告效果的指标CTR (Click Through Rate): 点击率CPC (Cost Per Click): 按点击计费CPA (Cost Per Action): 按成果数计费CPM (Cost Per Mille): 按千次展现计费PV (Page View): 流量ADPV (Advertisement Page View翻译 2017-12-18 11:27:12 · 18006 阅读 · 0 评论 -
CTR预估的几种方式
1.CTR预估CTR预估是计算广告中最核心的算法之一,那么CTR预估是指什么呢?简单来说,CTR预估是对每次广告的点击情况做出预测,预测用户是点击还是不点击。具体定义可以参考 CTR. CTR预估和很多因素相关,比如历史点击率、广告位置、时间、用户等。CTR预估模型就是综合考虑各种因素、特征,在大量历史数据上训练得到的模型。CTR预估的训练样本一般从历史log、离线特征库获得。样本标签相对容易,用户转载 2017-12-11 20:46:55 · 24477 阅读 · 0 评论