第3章 实时数仓项目(面试 重中之中)
最新推荐文章于 2025-05-19 14:03:21 发布
随着业务发展,实时数仓成为必要,项目采用与离线相同的架构和服务器选型。通过数据调研和建模,构建ODS、DWD、DIM和DWS层。数据量大,如用户行为数据达1亿条。项目中遇到FlinkCDC选择、状态后端问题、数据倾斜等挑战。使用Kafka、Maxwell进行数据采集,Hbase存储维度数据,ClickHouse进行聚合分析,同时关注一致性问题。

最低0.47元/天 解锁文章
977

被折叠的 条评论
为什么被折叠?



