Flume抽取SQL Server设计方案

最新推荐文章于 2025-04-22 00:16:26 发布

原创最新推荐文章于 2025-04-22 00:16:26 发布 · 2.9k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

FLUME 专栏收录该内容

10 篇文章

订阅专栏

本文针对项目需求，设计了两种实时数据分析方案。方案一利用MySQL触发器结合Kettle完成数据同步，但较为复杂；方案二使用Flume增量抽取SQLServer表数据，并通过MySQL触发器捕获变更数据，再用SparkStreaming处理，实现更简洁高效。

一、需求

因项目需要对数据进行实时分析展示，需要实时收集关系性数据中的数据

二、设计方案

方案一

(1)为mysql创建 trigger

(2)通过创建是trigger去触发jave程序

(3)通过java程序去触发kettle.job实现数据的抽取同步。

总结：此方案设计复杂，繁琐。

方案二

(1)使用flume抽取sql server :board表中的数据，flume只能增量抽取，无法处理更新的数据

(2)为mysql创建 trigger,通过trigger将有变更的数据存到A表中

(3)使用flume抽取A表有更新的数据

(4)在Spark Streaming 中使用RDD对这两部分数据进行处理，使用filter得到真实的数据，进行相应的计算，实现实时的功能。

总结：实现起来简单，配置下flume就实现数据收集，程序开发也简单，所以最终采用的第二种方式，详细请查看后面的博文

《Flume抽取SQL Server设计方案具体实现》

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。