推荐概念
- -信息过滤系统 解决 信息过载 用户需求不明确的问题 `
- 利用一定的规则将物品排序,展示给需求不明确的用户
- 推荐 搜索区别
- 推荐个性化较强,用户被动接受,希望能够提供持续的服务
- 搜索个性化弱,用户主动搜索,快速满足用户需求
- 推荐和web项目区别
- 构建稳定的信息流流通通道
- 推荐信息过滤系统
- web 对结果有明确预期
- 推荐 结果是概率问题
推荐系统整体架构
大数据Lambda架构
Lambda架构提供了一个结合实时数据和 Hadoop预先计算的数据环境和混合平台,提供一个实时的数据视图
-
离线计算和实时计算共同提供服务的问题
-
离线计算的优缺点
- 优点 能够处理的数据量可以很大 比如pb级别
- 缺点 速度较慢 分钟级别的延迟 -
实时计算
- 优点 响应快 来一条处理一条ms级别响应
- 缺点 处理的数据量小一些 -
离线计算的框架
- hadoop
- spark core, spark sql -
实时计算框架
- spark streaming
- storm
- flink -
消息中间件
- flume 日志采集系统
- kafka 消息队列 -
存储相关
- hbase nosql数据库
- hive sql 操作hdfs数据
Lambda架构图
- 推荐算法架构
- 召回阶段
-
- 召回阶段