《华为数据之道》读书笔记五----面向联接共享的数据底座建设

        4、数据入湖方式

        数据入湖有以下5种主要技术手段。

        1)批量集成(Bulk/Batch Data Movement)。对于需要进行复杂数据清理和转换且数据量较大的场景,批量集成是首选。通常,调度作业每小时或每天执行,主要包含ETL、ELT和FTP等工具。批量集成不适合低数据延迟和高灵活性的场景。

【备注说明】离线数据批量入湖场景。

        2)数据复制同步(Data Replication/Data Synchronization)。适用于需要高可用性和对数据源影响小的场景。使用基于日志的CDC捕获数据变更,实时获取数据。数据复制同步不适合处理各种数据结构以及需要清理和转换复杂数据的场景。

【备注说明】基于日志捕获的增量场景。

        3)消息集成(Message-Oriented Movement of Data)。通常通过API捕获或提取数据,适用于处理不同数据

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值