电子商务中的点击流数据分析
1. 点击流会话事实表设计
1.1 设计思路
为了基于网络服务器日志数据设计主要的点击流维度模型,同时避免第一个事实表规模过大,我们选择以每个完整的客户会话为一行的粒度。例如,一个大型网站每天可能有超过1亿次页面获取和10亿个微页面事件,但这些可能会归结为2000万个完整的访客会话。
1.2 维度选择
适合该事实表的维度包括日历日期、一天中的时间、客户、页面、会话和推荐来源。同时,还可以添加一组针对该会话的度量事实,如会话秒数、访问页面数、下单数、订购数量和订单金额。以下是该事实表的结构:
| 维度/事实 | 描述 |
| — | — |
| 通用日期键(FK) | 关联通用日期维度 |
| 通用日期/时间 | 通用的日期和时间戳 |
| 本地日期键(FK) | 关联本地日期维度 |
| 本地日期/时间 | 本地的日期和时间戳 |
| 客户键(FK) | 关联客户维度 |
| 入口页面键(FK) | 关联入口页面维度 |
| 会话键(FK) | 关联会话维度 |
| 推荐来源键(FK) | 关联推荐来源维度 |
| 会话ID(DD) | 唯一标识会话 |
| 会话秒数 | 客户在本次会话中在网站上花费的总秒数 |
| 访问页面数 | 本次会话中访问的页面数量 |
| 下单数 | 本次会话中下达的订单数量 |
| 订购数量 | 本次会话中订购的产品数量 |
| 订单金额 | 本次会话中的订单总金额 |
超级会员免费看
订阅专栏 解锁全文
2347

被折叠的 条评论
为什么被折叠?



