注:本篇文章阐述的是StarRocks-3.2版本的Routine Load导入机制
一、概述
Routine Load(例行导入)支持用户提交一个常驻的导入任务,可以将消息流存储在 Kafka 的Topic中,通过订阅Topic 中的全部或部分分区的消息,从而实现数据不间断的导入至 StarRocks。(Routine Load任务是常驻进程)
Routine Load 支持 Exactly-Once 语义,能够保证数据不丢不重。支持从Kakfa集群中消费 CSV、JSON、Avro (自 v3.0.1) 格式的数据。
官网文档地址:
使用 Routine Load 导入数据 | StarRocks
CREATE ROUTINE LOAD | StarRocks
总结:通过在数据库侧建立常驻消费者进程来拉取位于流系统上的数据,该消费者进程会按照定义好的消费逻辑和间隔,攒批数据之后调用stream load导入机制来实现数据导入。
二、Routine Load原理
2.1 流程图
Routine Load的导入执行流程如下:

本文详细介绍了StarRocks3.2版本的RoutineLoad功能,一个支持Exactly-Once语义的常驻导入机制,通过Kafka消费数据并保证数据完整性。文章覆盖了流程、原理、注意事项和应用案例,展示了如何使用RoutineLoad实现数据无缝导入。
最低0.47元/天 解锁文章
284

被折叠的 条评论
为什么被折叠?



