实时增量同步之海量(15T～) 图片数据

最新推荐文章于 2025-05-17 16:44:54 发布

little_bee_2004

最新推荐文章于 2025-05-17 16:44:54 发布

阅读量251

点赞数

文章标签：大数据

本文为博主原创文章，未经博主允许不准转载。

本文链接：https://blog.youkuaiyun.com/little_bee_2004/article/details/116604670

版权

灵蜂ETL工具产品之 BeeDI 应对海量（15T~)图片数据同步解决方案：

一、完成数据同步需要2个过程：

1、历史数据同步——2、实时增量同步

二、环境、数据量级

主库环境：Oracle RAC+ASM，内存64G 从库单实例环境：内存192G

历史数据 19T 日增归档100G 主库包含 15T 图片数据 (单表约6000万条记录)

三、主要问题：

历史数据同步：初始采用Oracle导入导出方式（IMP/EXP），海量图片数据由于记录数庞大导致EXP 过程超时无法正常倒出数据

实时增量同步：采用日志解析方式 从日志文件中解析同步增量数据，但是同步延迟很大，难以满足实时同步要求。

四、灵蜂ETL工具产品 BeeDI 解决方案

1、历史数据同步

采用BeeDI时间戳 断点续传 功能，在同步BLOB表失败后通过断点分批同步数据最终通过20多日完成所有表历史数据同步。

BeeDI 全量界面

2、实时增量同步

依次对主从服务器内存、网络、IO进行分析，最终确定性能瓶颈在于主库的归档读取性能低，RAC的2个实例归档位置指向不同的ASM磁盘组（+FRADG和+DATADG），而其中一个实例的归档与数据文件共用同一磁盘组（+DATADG），由于业务数据频繁写入，导致该磁盘组的归档读取性能很低。

将2个实例的归档位置合并到同一磁盘组（+FRADG），实现业务数据IO独立于归档IO。

归档位置合并后的日志读取性能大幅提升，原来导入1G数据需要7秒，而调整后不到3秒，BeeDI 可以满足同步100G新增日志/日

BeeDI 增量界面

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。