推荐系统特征维度

在推荐系统中,特征的本质是“对某个行为相关信息的抽象表达”。抽取特征时,尽量保留“推荐环境及用户行为过程中的所有有用信息”,摒弃冗余信息。

用户行为数据

显性反馈:评分、点赞等;隐性反馈:点击、播放时长、加购等。

用户行为类特征向量:
(1)代表用户行为的物品id序列,转化成multi-hot向量。
(2)预训练好的物品embedding向量,再average pooling或attention 生成历史行为embedding向量。

用户关系数据

社交网络,显性关系:好友、关注;隐形关系:点赞、同时对某一物品有行为。
(1)基于用户关系,制定召回层的物品召回策略。
(2)Graph Embedding方式生成用户和物品的Embedding。
(3)利用与用户A 有关系的用户B数据,添加用户A新的属性特征。

属性、标签类数据

用户属性、物品属性、标签类数据是最重要的描述型特征。通常,会建立维护一套用户和物品的标签体系,或者以社交化的方法ugc添加标签。

内容类数据

描述物品或用户的数据,相比标签类特征,内容类数据往往是“大段的描述型文字、图片、视频”。一般,内容类数据无法直接转换成推荐系统直接用的特征,需要通过nlp、cv技术手段提取关键内容特征,在输入推荐系统。即,转化成标签类数据。

上下文信息

描述推荐行为产生的场景信息,包括时间、地点、季节、天气、社会大事等。引入此类特征,可保存推荐行为发生场景的信息。

统计类特征

通过统计方法计算出的特征,包括ctr、物品流行度等。一般是连续型特征,需要输入推荐系统前,做标准化、归一化等处理(统一量纲、非线性log变换)。统计特征,本质上是一些粗粒度的预测指标,往往与最后的预测目把有较强相关性。

组合类特征

不同特征进行组合后形成的新特征,如年龄+性别。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值