
数据同步项目总结
数据同步项目中的一些总结与反思
BarackHusseinObama
好玩,Interesting
展开
-
数据同步项目总结2-数据流
数据流是指数据从源端存储库到目的端存储库的一个流动过程,这个过程与数据的有序性、吞吐量、安全点、统计等功能或特性息息相关,经过多次调整,最终在线上环境的测试中,单个作业的 SQLServer -> Kafka 的同步速度能够维持在 3800000+ rows、480M 每分钟的同步速度(线上环境硬件配置好,开发环境性能下降 3.5 倍左右),尽管多线程任务的数量没有刻意增大,但是这已经能满足...原创 2020-03-24 23:30:33 · 1008 阅读 · 3 评论 -
数据同步项目总结1-数据实时同步的要点
目录一、高效的数据同步模型流式 + 批次的数据同步模型多任务多通道/单通道的线程模型二、数据的一致性与时序性1. 数据全局有序2. 数据以主键为单位的顺序一致三、游标与断点续传四、总结这里的数据实时同步是指近乎实时的将数据从源端数据库同步到其它目的端数据库的一种方式,比如 MySQL 中的数据在发生变化时,系统能够尽可能实时的将这部分变化的数据同步到 HBase 中或其他目的端。与离线数据同步不...原创 2019-12-17 23:07:22 · 2664 阅读 · 0 评论