大数据量下的实时报表设计与实现(笔记)

目录

3.2 报表系统架构的改进

3.2.1 原有报告系统的问题:

3.2.2 改进方案:

3.2.2 同步模块架构设计

4.3 分布式服务架构

5.2.1关系型数据库现状分析——分库分表

5.2.3 字表导入FDFS 模块的设计与实现

5.3.2 Hive 绑定模块的设计与实现

5.4 宽表合成模块

5.5 索引文件生成

6.2.3 增量数据同步流程


https://www.doc88.com/p-2052553782070.html

3.2 报表系统架构的改进

3.2.1 原有报告系统的问题:

  1. 不及时
  2. 业务逻辑冗余,难以维护
  3. 数据藏的虎的数据同步用脚本单线程导入,慢,时间长

3.2.2 改进方案:

1.原有架构缺乏实时性,是因为选择离线计算模式处理数据。垮裤跨表查询性能不足,不支持跨库跨表。

  • 可选择分布式索引来提供复杂业务的实时数据查询。

  • 同事保证是增量数据的实时同步,应当保证数据库的数据在发生变化后及时更新到分布式索引中去。

2.将报表的业务剥离出来,形成独立于其他系统的报表服务

3.原来的架构中数据的同步和计算是写在脚本文件中直接分布在Hadoop的NameNode的节点上,工作效率不高。

应该充分利用HDFS(分布式文件系统(Hadoop Distributed File System))的高吞吐量的特性,缩短数据库同步至数据库同步中Hadoop集群的时间。

可以利用Java<

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值