电子商务点击流数据建模与分析
1. 点击流会话事实表设计
在拥有了一系列有用的点击流维度后,我们可以基于Web服务器日志数据设计主要的点击流维度模型,这个业务流程可以集成到其他网络零售主题领域中。
为避免第一个事实表过度膨胀,我们选择以每个完整的客户会话为一行的粒度。这个粒度比底层Web服务器日志的粒度要高,服务器日志会记录每个单独的页面事件,包括单个页面以及页面上的每个图形元素。虽然通常建议从源系统中最细粒度的数据开始,但这里是有意偏离标准做法。假设一个大型网站每天记录超过1亿次页面提取和10亿个微页面事件(图形元素),我们可以将其归结为2000万个完整的访客会话(如果平均每个访客会话访问5个页面)。
适合这个事实表的维度包括日历日期、一天中的时间、客户、页面、会话和推荐来源。此外,还可以添加一组测量事实,如会话秒数、访问页面数、下单数、订购数量和订单金额。其设计如下:
| 表名 | 字段 | 说明 |
| ---- | ---- | ---- |
| Date Dimension (2 views for roles) | Universal Date Key (FK)、Universal Date/Time、Local Date Key (FK)、Local Date/Time | 日期维度,有两个视图用于不同角色,分别记录通用日期和本地日期 |
| Clickstream Session Fact | Customer Key (FK)、Entry Page Key (FK)、Session Key (FK)、Referrer Key (FK)、Session ID (DD)、Session Seconds、Pages Visite
超级会员免费看
订阅专栏 解锁全文
1487

被折叠的 条评论
为什么被折叠?



