商业智能,数据仓库,ETL,数仓调度工具informatica介绍手账(一)

商业智能

什么是商业智能?什么样的企业需要商业智能?大家知道商业银行所涉及的系统非常之多,银行网点也非常之多,每家网点现金流入、流出每天都是不一样的,那么银行面临的问题出现了,如何平衡各网点现金流?

商业智能的作用在于帮助你将一些数据转化成具有商业价值,而且能够从中获取有用信息传递给需要的对应系统。例如,你购买餐巾纸,大瓶可乐以及零食,系统会提示你是否想要购买一次性纸杯。数据可以转化为信息,最后转化成利润。这便是商业智能的作用。银行经过多年的经营或ERP系统的运行,坐拥大量的经营数据,如何将这些大量的数据转化为信息传达给银行领导,并转化成利润,这便是商业智能的工作。就好像是采矿将开采出的矿石提纯做成煤炭或者钻石。

商业智能的实现:首先需要银行系统体系结构的设计,数据库,数据抽取、转换、清洗(ETL),前端web开发,元数据的应用。

商业智能的实施方案:

(1)需求定义:需求分析是商业智能的重要阶段,描述项目的背景目的,以及业务需求与功能需求等。各业务系统多种多样,数据冗余,复杂,以及各业务系统数据存在不统一,报表展示单一,数据分散等情况,行方高层领导无法站在更高层次上去对业务进行分析 从而做出重大决策。例如,A系统库中性别字段男为Y,女为N;B系统库中男为1,女为0。因此商务智能项目在于解决各业务系统数据集中整合问题,因此需要数据抽取,数据清洗,数据转换等步骤。

业务需求:业务需求是用来描述与客户关系管理,以不同的方式分析,以报表的形式呈现。

功能需求:包含各业务系统的分析,监控,报表查询,数据挖掘等。

(2)数仓模型的创建:数仓的模型建立在需求分析的基础上,开发前业务与需求人员参与设计,并与核心系统人员沟通,最后设计出物理模型。

(3)数据抽取,数据清洗,数据转换,数据加载(ETL):

         抽取:将数仓需要的数据从各个业务系统中抽取出来。(如果每个系统的数据的状况不同,则需对数据源进行单独抽取,抽取 时间可以设置绝对时间或是相对时间)

         清洗:对源数据进行清洗和确认,检查所抽取的源数据是否符合数仓的规范,清洗分两种有不同业务系统间有独自的专用清洗流程,和另一种不同业务系统满足数仓清洗的通用清洗。以便于确保源数据没有多余杂质。

         转换:对源数据进行修改,进行聚合或者计算,转换。(该步骤在ETL中复杂度最高)

         加载:将数据加载到最后目标表中,通过批量装载,跑批的形式实现。

(4)建立分析报表:商业智能分析报表通过对数仓中数据的分析,使行方高层可以从多种角度查看银行运营状况,探查银行内部核心数据,以便于对银行未来发展做出预测。

整体步骤大致如下:

 上述为商务智能理论体系。后继更新数仓与ETL详细步骤。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值