推荐系统架构与机器学习基础理论

本文探讨了推荐系统的发展、架构和机器学习基础,包括80/20原则、长尾效应及其解决思路,新算法上线流程和用户满意度策略,以及RMSE、MAE、信息熵和基尼系数等评估指标。同时,介绍了如何抵御行为注入攻击,保障系统多样性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

推荐系统架构与机器学习基础理论

机器学习之推荐系统发展概述与架构原理
  1. 机器学习“思维”
  2. 推荐系统的应用场景
  3. 推荐系统的架构
机器学习出现的原因

在这里插入图片描述

优化问题与凸优化问题

在这里插入图片描述

一维与多维

在这里插入图片描述

推荐系统的出现背景

信息过载

  1. 分类导航:信息缺乏,用户主动寻找信息
  2. 搜索引擎:信息丰富,用户主动寻找信息
  3. 推荐系统:信息泛滥,信息寻找用户
搜索引擎与推荐系统的区别

搜索引擎与推荐系统的主要区别:

  1. 搜索引擎:满足用户有明确目的时主动查找的需求
  2. 推荐系统:帮助用户在没有明确目的时,发现感兴趣的 内容
对舰系统的构成

在这里插入图片描述

推荐系统架构

在这里插入图片描述

推荐系统的再次认识

在这里插入图片描述

80/20原则与长尾效应

本节目标
  1. 物品流行度分析
  2. 长尾效应的解决思路
80/20原则
  • 80/20原则: 80%的销售额来源于20%的热门商品
  • 原因:喜爱热门商品的用户数更多,如果不知道用户的喜好,推 荐热门商品更加保险
长尾效应

在这里插入图片描述

长尾效应的解决思路
  1. 用户分析
    新用户:倾向于浏览热门商品
    老用户:逐渐开始浏览冷门物品
  2. 新颖度
  3. 覆盖度
总结
  1. 物品流行度分析
  2. 长尾效应的解决思路

新算法上线流程与用户满意度手机策略

新算法上线流程

第一步:离线实验
第二步:用户调查
第三步:在线AB测试

离线实验:
  1. 日志生成标准数据集
  2. 数据集分为训练集和测试集
  3. 训练集上训练模型,测试集上进行预测
  4. 根据指标,评价预测结果
用户调查:
  1. 高预测准确率不等于用户满意度
  2. 算法上线测试之前需要真实用户来参与测试

注: 要保证参与测试的用户与实际用户分布相同

在线实验:
  1. AB测试:新算法与旧算法进行比较

注: 在线实验的成本更高,只有离线实验和用户调查中表现都很 好的算法才可以进行

新算法最终上线的条件:
  1. 在离线指标上优于现有算法
  2. 用户调查满意度不低于现有算法
  3. 在线AB测试结果优于现有算法

用户满意度收集策略

  1. 调查问卷
  2. 点击率
  3. 用户停留时间
  4. 转化率
  5. 标签反馈

总结

  1. 新算法上线流程:
    离线实验、用户调查、在线AB测试
  2. 用户满意度的收集策略

RMSE与MAE评价准确度

RMSE和MAE

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

准确率与召回率

在这里插入图片描述
在这里插入图片描述

信息熵与基尼系数衡量覆盖率

  1. 理解信息熵和基尼系数
  2. 覆盖度公式与分析
信息熵

在这里插入图片描述

基尼系数

在这里插入图片描述

覆盖度

在这里插入图片描述

多样性的度量——相似度

多样性

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

抵御行为注入攻击策略

行为注入攻击

在这里插入图片描述

行为注入攻击的防范
防范方式: 
	1. 使用高代价的用户行为 
	2. 使用数据前进行攻击检测,对数据清理
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值