目录
https://www.doc88.com/p-2052553782070.html
3.2 报表系统架构的改进
3.2.1 原有报告系统的问题:
- 不及时
- 业务逻辑冗余,难以维护
- 数据藏的虎的数据同步用脚本单线程导入,慢,时间长
3.2.2 改进方案:
1.原有架构缺乏实时性,是因为选择离线计算模式处理数据。垮裤跨表查询性能不足,不支持跨库跨表。
-
可选择分布式索引来提供复杂业务的实时数据查询。
-
同事保证是增量数据的实时同步,应当保证数据库的数据在发生变化后及时更新到分布式索引中去。
2.将报表的业务剥离出来,形成独立于其他系统的报表服务
3.原来的架构中数据的同步和计算是写在脚本文件中,直接分布在Hadoop的NameNode的节点上,工作效率不高。
应该充分利用HDFS(分布式文件系统(Hadoop Distributed File System))的高吞吐量的特性,缩短数据库同步至数据库同步中Hadoop集群的时间。
可以利用Java<