我们这里从kafka的ods层读取用户行为日志以及业务数据,并进行简单处理,写回到kafka作为dwd层。
每层的职能
| 分层 | 数据描述 | 生成计算工具 | 存储媒介 |
|---|---|---|---|
| ODS | 原始数据,日志和业务数据 日志服务器, | maxwell | kafka |
| DWD | 根据数据对象为单位进行分流,比如订单、页面访问等等。 | FLINK | kafka |
| DWM | 对于部分数据对象进行进一步加工,比如独立访问、跳出行为。依旧是明细数据。 | FLINK | |
| DIM | 维度数据 | FLINK | HBase |
| DWS | 根据某个维度主题将多个事实数据轻度聚合,形成主题宽表。 | FLINK | Clickhouse |
| ADS | 把Clickhouse中的数据根据可视化需要进行筛选聚合。 | Clickhouse SQL | 可视化展示 |
本文介绍了一种基于Kafka的大数据处理流程,包括从原始数据读取到最终主题宽表的生成。涵盖ODS、DWD、DWM等层级的数据处理方法及使用的工具如Flink、ClickHouse。
585





