
推荐系统
migushu3
这个作者很懒,什么都没留下…
展开
-
新闻推荐-特征工程--直播内容
新闻推荐的流程:--> 海量文章(召回,通过召回策略得到了每个用户的候选商品,简单通过相似性等,从几十万得到几百篇几十篇等,规则简单,注重快,降低文章规模) --> 候选文章(排序,聚焦在准确,将候选物品的特征,及用户本身的属性、兴趣特征等拼接到一起)--> 排序列表(规则)--> 排序列表1、为什么要特征工程数据和特征决定了机器学习的上限,而模型和算法只能逼近这个上限而已。模型越好,模型灵活性越强、模型越简单、模型效果越出色。2、从召回结果到监督数据集新原创 2020-12-03 21:48:13 · 457 阅读 · 0 评论 -
Task03: 多路召回(3天)
多路召回指采用不同的策略、特征或简单模型,分别召回一部分候选集,然后把候选集混合在一起供后续排序模型使用,可以明显的看出,“多路召回策略”是在“计算速度”和“召回率”之间进行权衡的结果。其中,各种简单策略保证候选集的快速召回,从不同角度设计的策略保证召回率接近理想的状态,不至于损伤排序效果。如下图是多路召回的一个示意图,在多路召回中,每个策略之间毫不相关,所以一般可以写并发多线程同时进行,这样可以更加高效。未完待续—...原创 2020-11-30 20:54:17 · 197 阅读 · 0 评论 -
天池新闻推荐入门赛之【数据分析】Task02
1.导包# 导入相关包%matplotlib inlineimport pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsplt.rc('font', family='SimHei', size=13)import os,gc,re,warnings,syswarnings.filterwarnings("ignore")2、读取数据 path = './data_r原创 2020-11-27 23:01:42 · 147 阅读 · 1 评论 -
赛题理解+Baseline
推荐系统入门一、常用评测指标:用户满意度预测准确度:又分为评分预测:预测准确度一般通过RMSE和MAE来进行计算,TopN推荐:预测准确率指标:精确率和召回率覆盖率:信息熵定义和基尼系数定义覆盖率多样性新颖性AUC曲线:包括TP、FN、FP、TN二、推荐系统核心算法层召回层:缩小候选集规模,数据量大,用少量特征+简单模型主流方法:多路召回策略,具体策略与业务相关Embedding召回Embedding目的:把稀疏向量转换为稠密向量,相当于对o原创 2020-11-25 21:35:02 · 300 阅读 · 0 评论