推荐系统,写的特别好

本文介绍了推荐系统,其数学定义是为用户找到使评判函数最大的推荐内容,通俗来说是根据用户多方面信息判断需求。还阐述了推荐系统的结构、评估标准,如准确度、覆盖率、多样性等,以及类型,包括基于内容、协同过滤和隐语义模型的推荐系统。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、什么是推荐系统?

我们每天都在有意识无意识接触推荐系统,比如:

一种数学定义为:

设C为全体用户集合;
设S为全部商品/推荐内容集合;
设u是评判把si推荐给ci的好坏评判函数;
推荐是对于c∈C,找到s∈S,使得u最大,即

部分场景下是Top N的推荐,即不止推荐一个si,把多个感兴趣的si做排序推荐给用户。
通俗地说,推荐系统需要根据用户的历史行为、社交关系、兴趣点、所处上下文环境等信息去判断用户的当前需求/感兴趣的item。

二、推荐系统结构

三、推荐系统评估标准

1、准确度:

①、打分系统:
设r_ui为用户u对物体i的实际评分,(r_ui ) ̂ 为预测评分,则有如下误差判断标准:

②、Top N推荐
设R(u)为根据训练建立的模型在预测集上的推荐,T(u)为预测集上用户的选择。

准确率vs召回率

2、覆盖率(针对商家)

表示对物品长尾的发掘能力(推荐系统希望消除马太效应),即不仅对热门的物品有推荐,对冷门的物品也要有推荐。

熵:

即卖出的种类越平均,熵H越大。

3、多样性(针对用户)

优秀的推荐系统能保证推荐结果列表中物品的丰富性(两两之间的差异性)。设s(i,j)表示物品i和j之间的相似度,多样性表示如下:

公式1为1-平均相似度,平均相似度越小,差异度越大。

除上述之外,还有其他的评估标准,如:
新颖度:商品给用户的新鲜感;
惊喜度:推荐和用户的历史兴趣不相同,却满意的
信任度:提供可靠的推荐理由
实时性:实时更新程度

四、推荐系统类型

推荐系统1:基于内容

通常使用在文本相关产品上进行推荐,基于用户喜欢的物品的属性/内容进行推荐。
对于每个要推荐的内容,我们需要建立一份资料:
比如词k_j在文件d_i中的权重w_ij,常用的方法比如TF-IDF,TF为某个词在该文章中出现的频率,IDF为该次在所有同类文章中出现的频率,则TF越大,IDF越小,权重w就越大。
对用户也需要建立一份资料:
比如说定义一个权重向量(w_c1,…,w_ck),其中w_ci表示第i个词对用户c的重要度。
计算匹配度
比如用余弦距离公式:

推荐系统2:协同过滤

协调过滤是一种基于“近邻”的推荐算法,根据用户在物品上的行为找到物品或者用户的“近邻”。

基于物品的协同过滤(item-based CF):
对于有相同用户交互的物品,计算物品相似度;
找到物品“近邻”,进行推荐。

如何计算相似度:
定义一个用户序列u_i,i=1…n,一个物品序列p_j,j=1…m,n*m得分矩阵v,每个元素v_ij表示用户i对物品j的打分。
计算物品i与物品j之间的相似度/距离:

sim(1,m)为第一部电影与各部电影的pearson距离。可以看出,3、6两部电影离第一部电影的距离最近。则用户5对第一部电影的评分预测为:

基于用户的协同过滤(user-based CF):
基于用户的共同行为的物品,计算用户相似度;
找到“近邻”,对近邻在新物品的评分(打分)加权推荐。

如何计算相似度:
定义一个用户序列u_i,i=1…n,一个物品序列p_j,j=1…m,n*m得分矩阵v,每个元素v_ij表示用户i对物品j的打分。
计算用户相似度(距离):

预测得分:

计算第五个用户与各个用户之间的pearson距离,然后加权计算用户5对电影1的预测得分(过程同基于物品的协同过滤)。

相似度/距离定义:

推荐系统3:隐语义模型


作者:西海岸看日出
来源:优快云
原文:https://blog.youkuaiyun.com/qq_38236355/article/details/89159564
版权声明:本文为博主原创文章,转载请附上博文链接!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值