推荐系统特征维度

最新推荐文章于 2024-07-29 18:06:19 发布

原创最新推荐文章于 2024-07-29 18:06:19 发布 · 1.3k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

推荐系统专栏收录该内容

12 篇文章

订阅专栏

在推荐系统中，特征的本质是“对某个行为相关信息的抽象表达”。抽取特征时，尽量保留“推荐环境及用户行为过程中的所有有用信息”，摒弃冗余信息。

用户行为数据

显性反馈：评分、点赞等；隐性反馈：点击、播放时长、加购等。

用户行为类特征向量：
（1）代表用户行为的物品id序列，转化成multi-hot向量。
（2）预训练好的物品embedding向量，再average pooling或attention 生成历史行为embedding向量。

用户关系数据

社交网络，显性关系：好友、关注；隐形关系：点赞、同时对某一物品有行为。
（1）基于用户关系，制定召回层的物品召回策略。
（2）Graph Embedding方式生成用户和物品的Embedding。
（3）利用与用户A 有关系的用户B数据，添加用户A新的属性特征。

属性、标签类数据

用户属性、物品属性、标签类数据是最重要的描述型特征。通常，会建立维护一套用户和物品的标签体系，或者以社交化的方法ugc添加标签。

内容类数据

描述物品或用户的数据，相比标签类特征，内容类数据往往是“大段的描述型文字、图片、视频”。一般，内容类数据无法直接转换成推荐系统直接用的特征，需要通过nlp、cv技术手段提取关键内容特征，在输入推荐系统。即，转化成标签类数据。

上下文信息

描述推荐行为产生的场景信息，包括时间、地点、季节、天气、社会大事等。引入此类特征，可保存推荐行为发生场景的信息。

统计类特征

通过统计方法计算出的特征，包括ctr、物品流行度等。一般是连续型特征，需要输入推荐系统前，做标准化、归一化等处理（统一量纲、非线性log变换）。统计特征，本质上是一些粗粒度的预测指标，往往与最后的预测目把有较强相关性。

组合类特征

不同特征进行组合后形成的新特征，如年龄+性别。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。