- 博客(3)
- 收藏
- 关注
原创 流批一体(APP)
流批一体(Stream-Batch Unification)是一种打破传统数据处理割裂的架构理念,通过统一技术框架实现实时流数据与历史批数据的一体化处理。在APP场景中,其核心价值在于用同一套逻辑同时支撑实时响应和离线分析需求,典型应用包括:实时个性化推荐(融合短期行为与长期画像)、实时监控与异常排查(统一指标口径)、用户增长分析(同步漏斗计算)以及实时消息触达(共享标签体系)。该架构能提升用户体验一致性、降低团队协作成本,但存在技术门槛高、小型APP可能不适用等挑战。关键技术组件包括Flink(实时计算)
2025-09-22 16:10:19
986
1
原创 Flink数据倾斜优化 FlinkSql及FlinkDataStream
1).现象:相同 Task 的多个 Subtask 中,个别 Subtask 接收到的数据量明显大于其他 Subtask 接收到的数据量,通过Flink Web U1 可以精确地看到每个 Subtask 处理了多少数据,即可判断出 Flink 任务是否存在数据倾斜。通常,数据倾斜也会引起反压。2).解决:(1)数据源倾斜比如消费 katka,但是 katka 的 topic 的分区之间数据不均衡读进来之后调用重分区算子:rescale、rebalance、shuffle,(2)单表分组聚合(纯流式)倾斜AP
2024-12-13 17:10:39
1829
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅