40、电子商务点击流数据建模与分析

电子商务点击流数据建模与分析

1. 点击流会话事实表设计

在拥有了一系列有用的点击流维度后,我们可以基于Web服务器日志数据设计主要的点击流维度模型,这个业务流程可以集成到其他网络零售主题领域中。

为避免第一个事实表过度膨胀,我们选择以每个完整的客户会话为一行的粒度。这个粒度比底层Web服务器日志的粒度要高,服务器日志会记录每个单独的页面事件,包括单个页面以及页面上的每个图形元素。虽然通常建议从源系统中最细粒度的数据开始,但这里是有意偏离标准做法。假设一个大型网站每天记录超过1亿次页面提取和10亿个微页面事件(图形元素),我们可以将其归结为2000万个完整的访客会话(如果平均每个访客会话访问5个页面)。

适合这个事实表的维度包括日历日期、一天中的时间、客户、页面、会话和推荐来源。此外,还可以添加一组测量事实,如会话秒数、访问页面数、下单数、订购数量和订单金额。其设计如下:
| 表名 | 字段 | 说明 |
| ---- | ---- | ---- |
| Date Dimension (2 views for roles) | Universal Date Key (FK)、Universal Date/Time、Local Date Key (FK)、Local Date/Time | 日期维度,有两个视图用于不同角色,分别记录通用日期和本地日期 |
| Clickstream Session Fact | Customer Key (FK)、Entry Page Key (FK)、Session Key (FK)、Referrer Key (FK)、Session ID (DD)、Session Seconds、Pages Visite

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值