项目背景
随着“金税工程”的推进,税务信息化建设取得显著成就,但随着信息化探索的不断深入,从已经实施的一些数据利用类项目发现:以传统数据处理技术为主的系统,由于技术架构限制,不能满足大数据量下宏观经济分析、政策效应分析、行业风险监控等分析类业务需求,且无法高效支撑即席查询、复杂关联分析等税务大数据应用必须场景,影响税局用户和纳税人使用体验,不能充分发挥税务数据的价值。
需求分析
项目需求总结如下:
l 实现数据集中,提供数据统一视图,解决数据共享度低,有效信息不足等问题;
l 有效支撑海量数据高性能数据分析处理、挖掘,提升税务科学决策和风险防范能力;
l 能够依据数据量、业务量、用户量等因素灵活定制和弹性扩展,实现建设的可持续。
解决方案
某省地税最终选择GBase 8a MPP Cluster作为大数据平台的核心部件实现对海量数据资源存储整合,为税务业务提供统一、高效的大数据资源支撑。
GBase 8a MPP Cluster构建数据仓库层、数据指标层和数据集市层。大数据平台架构中,数据准备区表结构基本与源系统表结构一致,数据来源于多个业务系统;数据仓库层定期对数据进行加工和分层汇总;数据指标层利用仓库层的增量数据周期更新法人库、自然人库中的指标数据;数据集市层根据业务划分为多个集市,进行切片、钻取,为上层应用供数。
客户价值:
l 实现省级数据集中,整合税务系统内外部数据,实现数据集中共享;
l 提供复杂加工、即席查询、分析、汇总等深度分析能力,有效支撑税务大数据应用;
l 产品完全自主研发,国产可控,保证税务行业信息安全。