- 博客(18)
- 收藏
- 关注
原创 论文翻译-Article De-duplication Using Distributed Representations
基于文本的余弦相似度往往对标记为4和5的配对具有较高的值,但对于标记为1-3的配对,标签和分数之间的相关性较小。在这种情况下,如果按照用户的兴趣级别顺序呈现文章,这些文章往往会被靠近地展示,这可能会导致用户连续查看类似的文章而降低他们的满意度。虽然无监督的方法,如段落向量[1],可以用于这一目的,但我们的方法以监督的方式生成向量,使得向量的内积表示它们的相似性,以便适用于即时系统的快速计算。虽然使用它们中的单词共现可以检测到非常相似的文章,但在使用缩写或不同风格的文章的情况下,很难测量正确的相似性。
2023-05-05 22:08:33
165
原创 论文翻译-C2-Rec: An Effective Consistency Constraint for SequentialRecommendation
图1:CT4Rec的模型结构。它以用户点击序列为输入,在推荐的匹配阶段输出用于项目检索的用户表示。输入序列通过嵌入层转换为向量表示,然后通过N个具有不同隐藏层dropout掩码的transformer进行编码。此外,引入了分布式正则化损失和正则化dropout损失,以限制由不同dropout掩码生成的这些表示。我们的模型的总体结构如图1所示。在详细说明我们提出的CT4Rec之前,我们首先介绍一些必要的符号来描述序列项目预测任务。令U = (𝑢1,𝑢2,...,𝑢|U|)表示用户集合,V = (𝑣1,
2023-04-13 19:29:06
482
原创 论文翻译-Reweighting Clicks with Dwell Time in Recommendation
点击行为是推荐中使用最广泛的用户积极反馈。然而,在训练中简单地考虑每次点击可能会出现点击诱饵和标题内容不匹配,因此不能准确地捕捉用户对项目的真正满意度。停留时间可以被视为每次点击时用户偏好的高质量定量指标,而现有的推荐模型并没有充分探索停留时间的建模。在这项工作中,我们关注于在推荐中使用停留时间来重新加权点击量。准确地说,我们首先定义了一个名为有效读取的新行为,它有助于通过停留时间为不同的用户和项目选择高质量的点击实例。接下来,我们提出了一个归一化的停留时间函数来重新加权训练中的点击信号,这可以更好地指导我
2022-10-20 10:42:35
543
原创 论文翻译-Cross Pairwise Ranking for Unbiased Item Recommendation
大多数推荐系统对观察到的交互数据进行优化模型,这受到先前暴露机制的影响,表现出许多偏差,如流行偏差。损失函数,如大多数使用的点态二值交叉熵和成对贝叶斯个性化排序,并不是为了考虑观察数据中的偏差。因此,对损失进行优化的模型将继承数据偏差,或者更糟的是,放大了数据偏差。例如,一些受欢迎的项目占据了越来越多的暴露机会,严重损害了利基项目的推荐质量——这被称为臭名昭著的马太效应。在这项工作中,我们开发了一种新的学习范式,称为交叉成对排名(CPR),它在不知道暴露机制的情况下实现了公正的推荐。与逆倾向评分(IPS)不
2022-10-18 11:25:57
686
原创 论文翻译-Denoising Implicit Feedback for Recommendation
内隐反馈的普遍性使它们成为构建在线推荐系统的默认选择。虽然大量的隐式反馈减轻了数据的稀疏性问题,但缺点是它们在反映用户的实际满意度方面没有那么干净。例如,在电子商务中,很大一部分点击并不能转化为购买,许多购买最终会得到负面评论。因此,解释隐式反馈中不可避免的噪声对推荐人的训练至关重要。然而,很少有关于推荐的工作考虑到内隐反馈的噪声性质。在这项工作中,我们探讨了推荐训练去隐反馈的中心主题。我们发现了噪声隐式反馈的严重负面影响,即拟合噪声数据阻碍了推荐者学习实际的用户偏好。
2022-10-01 20:57:37
771
原创 论文翻译-Clicks can be Cheating: Counterfactual Recommendation for Mitigating Clickbait Issue
推荐是信息系统中一种普遍的和关键的服务。为了向用户提供个性化的建议,行业参与者采用了机器学习,更具体地说,是基于点击行为数据构建预测模型。这被称为点击率(CTR)预测,它已经成为建立个性化推荐服务的黄金标准。然而,我们认为点击量和用户满意度之间存在着很大的差距——用户通常会被诱人的标题/封面“欺骗”。如果用户发现所点击的项的实际内容令人失望,这将严重损害用户对系统的信任。更糟糕的是,在这些有缺陷的数据上优化CTR模型将会产生马太效应,让看起来有吸引力但实际上低质量的物品更经常被推荐。
2022-09-24 20:03:44
958
原创 论文翻译-Recommendation Unlearning
推荐系统通过从收集的数据中了解用户的个人偏好,提供基本的网络服务。然而,在许多情况下,系统还需要忘记一些训练数据。从隐私的角度来看,用户希望有一个工具来从训练过的模型中消除他们的敏感数据的影响。从实用程序的角度来看,如果一个系统的实用程序被一些坏的数据损坏了,系统需要忘记这些数据来重新获得实用程序。虽然遗忘非常重要,但在现有的推荐系统中还没有得到很好的考虑。虽然有一些研究对机器遗忘的问题进行了研究,但现有的方法由于不能考虑协作信息,因此不能直接应用于推荐。
2022-09-18 17:30:09
897
原创 论文笔记CIRS
个性化在增加了推荐系统的实用性的同时,也带来了过滤气泡的问题。这里的filter bubbles也就是信息茧房,在这里就是指推荐系统过于个性化,一直给用户推荐他喜欢的物品,这样就会使用户接受到的信息有限,并且长期下来会使用户感到厌烦。这是提出信息茧房的作者说的一句话这篇文章就是提出了一种模型来解决信息茧房问题。2.提出的模型作者认为信息茧房和过度暴露效应有关,并且将用户的满意度建模为用户的内在兴趣和过度暴露效应。......
2022-08-06 18:56:34
1004
原创 论文笔记(SESSION-BASED RECOMMENDATIONS WITHRECURRENT NEURAL NETWORKS)
因此,我们提出了一种基于RNN的方法来进行基于会话的推荐我们的方法也考虑到了任务的实际情况,并对经典的RNNs进行了一些修改,如一个排名损失函数,使其对这个特定的问题更加可行。首先说明了基于会话的推荐是一个相对不受重视的问题,因为会话行为的难以收集。许多电子商务平台不会长期跟踪访问其平台的用户的ID,即使跟踪是可能的许多用户在网站上也只会留下一两个会话。cookies能提供某种程度的用户可识别性但会引起一些隐私问题。...............
2022-07-23 21:26:13
624
原创 Embedding
embedding的出现是为了弥补one-hot在表示物品时的不足,当物品的数量变的很多时用one-hot表示的物品的向量就会变的很长,而且很稀疏,这不仅不利于存储而且对于神经网络的输入来说也是不适合的,另一个缺点就是one-hot向量不能很好的表示出两个物品之间的联系,因为任意两个向量的内积为0。embedding的出现就弥补了这种不足,他将one-hot的高维稀疏向量转换成低维稠密向量,这不仅减少了神经网络的输入维度,而且利用两个向量之间的余弦相似度还能推算出这两个物品的相似度。............
2022-07-16 21:59:17
841
原创 马尔可夫链
马尔可夫链是俄国数学家Andrey Andreyevich Markov研究并提出的一个用数学方法就能解释自然变化的一般规律模型,被命名为马尔科夫链(Markov Chain)。马尔可夫链是随机过程的一种,他要求随机过程具有“无记忆性”,也被叫做“马尔可夫性质”。随机过程就是使用统计模型对一些事物的过程进行预测和处理,例如天气预报预测今天是否下雨,通过今天股票的涨跌预测明天的股票情况等。“无记忆性”也就是指在一个时间序列中,本时刻发生的事情只和前一时刻发生的事情相关,和其他时刻发生的事情无关。例如在一个时间
2022-07-11 19:42:24
1085
原创 BPR(贝叶斯个性化排序)
BPR全称Bayesian Personalized Ranking,他是一种排序算法,并且使用隐式反馈(如点击,收藏等),通过对问题进行贝叶斯分析得到的最大后验概率来对item进行排序,进而产生推荐。传统的矩阵分解使用显示反馈通过对用户-物品的评分矩阵进行分解从而预测到用户对于未评分物品的得分,根据这个得分进行推荐。在实际中显示反馈有着较高的准确率,但它往往难以收集,我们有时候只能使用隐式反馈,它可以通过日志文件很方便的得到。显示反馈和隐式反馈的特点如下: 因为我们有时候只能使用隐式反馈所以传统的矩阵分解
2022-06-25 18:20:32
3958
原创 协同过滤(Collaborative Filtering)
协同过滤是推荐系统的重要思想之一,推荐系统是用来向用户推荐物品的。协同过滤分为三种:1.基于用户的协同过滤。2. 基于物品的协同过滤。3.基于模型的协同过滤(这里不再赘述)。无论是基于用户还是基于物品都是为了找到和用户可能喜欢的物品相似的物品把它给过滤出来,推荐给用户。1.基于用户的协同过滤思想:找到和该用户兴趣相似的用户,推荐该兴趣相似用户使用过但该用户没见过的物品。 用户 物品 A B C
2022-06-12 23:15:39
12002
原创 RNN原理
1.什么是RNNRNN(Recurrent Neural Network)循环神经网络,是用来专门处理序列数据的神经网络。百度百科关于时间序列数据的定义是这样的:时间序列数据是指在不同时间点上收集到的数据,这类数据反映了某一事物、现象等随时间的变化状态或程度。这是时间序列数据的定义,当然这里也可以不是时间,比如文字序列,但总归序列数据有一个特点——后面的数据跟前面的数据有关系。RNN的出现是为了解决全连接神经网络不能联系上下文去训练模型的缺点。有一个NLP很常见的问题命名实体识别,举个例子,有下面两
2022-04-17 18:06:33
4102
原创 梯度下降实例:一元线性回归
前言梯度下降作为一种求解函数局部最小值的方法,在机器学习的许多方面都有所体现,本文主要通过介绍一元线性回归进而引入梯度下降。1.一元线性回归首先要理解回归的概念。回归的目的就是通过几个已知数据来预测另一个数值型数据的目标值。假设特征和结果满足线性关系,即满足一个计算公式h(x),这个公式的自变量就是已知的数据x,函数值h(x)就是要预测的目标值。这一计算公式称为回归方程,得到这个方程的过程就称为回归。一元线性回归就是只包括一个自变量和一个因变量且二者之间的关系可以用一条直线表示,如果回归分析
2022-01-18 17:05:59
1395
原创 什么是正则化?他是如何起作用的?
过拟合,欠拟合,L1L2正则正则化可以理解为规则化,规则就等同于一种限制。在损失函数中加入正则化项可以限制他们的拟合能力,正则化就是为了防止过拟合,那么什么是过拟合?图1假如我们要构建的模型是能够区分图中的红色与蓝色部分,看图1的三种模型对训练集的拟合状态:第1种模型:欠拟合,此模型不能很好的区分图中的红色与蓝色部分。第2种模型:拟合状态刚好,虽然有个别红色部分未被区分但考虑到实际测试集中会有噪声的存在,其拟合程度就刚刚好。第3种模型:过拟合,此种模型对于训练集的拟合程度非常高,
2022-01-16 23:00:33
4422
1
原创 矩阵分解之知识点记录
图1 用户对不同物品的评分表如果给出如图1所示的一个用户对物品的评分表如何预测用户未打分的部分?可以使用矩阵分解来完成。矩阵分解的一个作用就是能用来预测如1所示的未知评分,那么如何进行矩阵分解?我们知道一个矩阵能表示成两个矩阵的乘积的形式即R(m,n)=P(m,k)*Q(k,n),那么对于一个特定的矩阵R我们就可以找到两个矩阵P,Q让P(m,k)*Q(k,n)≈R(m,n)。这样对于如图1所示的矩阵我们就可以预测出用户未打分的物品的分值是多少。k是一个用户自定义的值可以通过交叉验证的方法..
2022-01-13 22:21:17
748
原创 梯度下降示例
函数:y=(x-2.5)^2+3导数:y1=2x-5初始值x=1学习率:a=0.1终止条件:ε=0.001计算过程:x1=1-0.1*(2*1-5)=1.3x2=1.3-0.1*(2*1.3-5)=1.54x3=1.54-0.1*(2*1.54-5)=1.732x4=1.732-0.1*(2*1.732-5)=1.8856x5=1.8856-0.1*(2*1.8856-5)=2.00848...
2021-11-21 20:52:45
1321
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人