- 博客(5)
- 收藏
- 关注
原创 ETL工具之Informatica
这里写自定义目录标题Informatica简介PowerCenter功能简介全量接数/调度/监控增量接数/调度/监控Informatica简介Informatica平台是一套完善的技术,可支持多项复杂的企业级数据集成计划,包括:企业数据集成、大数据、数据质量控制、主数据管理、B2B Data Exchange、应用程序信息生命周期管理、复杂事件处理、超级消息和云数据集成。其下有众多产品,其中这...
2021-11-24 11:43:53
12342
1
原创 Oracle与Hive语法对比
在将oracle语法逻辑迁移到hive或者将hive语法逻辑迁移到oracle时,我们会面临语法不互通的问题,此时就需要了解语法逻辑进行转换加工之后才能以另外一种语法的逻辑实现.Oracle与Hive区别oracle是数据库,而hive是数据仓库,二者最大的区别就在于存储和计算.oracle数据库是支持存储计算功能的,Hive是基于hadoop的数据仓库工具,hive本身没有存储和计算能力,完...
2019-11-28 23:52:43
11389
5
原创 数据仓库---需求调研阶段
概况数据仓库建设的第一步就是调研,只有充分了解了客户的需求以及客户目前的一个业务/系统等状况,才能从广度和深度上做好需求调研为数据仓库建设建立良好的开端需求分类调研不同阶层: 通过对客户不同阶层的人员进行调研,更好地了解客户的问题及需求,以便于后期的建模工作更有针对性开展.具体人员: 由于业务人员不懂技术,它们以为需求都会得到满足。各个项目开发人员不懂业务,不熟悉整个业务场景。数据仓库团...
2019-09-29 18:05:33
2933
原创 浅谈数仓建模及其方法论
认识数据仓库1.数仓的定义:2.数据仓库和数据库的区别:数仓的发展1.简单报表阶段:这个阶段,系统的主要目标是解决一些日常的工作中业务人员需要的报表,以及生成一些简单的能够帮助领导进行决策所需要的汇总数据。这个阶段的大部分表现形式为数据库和前端报表工具。2.数据集市阶段:这个阶段,主要是根据某个业务部门的需要,进行一定的数据的采集,整理,按照业务人员的需要,进行多维报表的展现,能够提...
2019-09-21 12:09:44
5835
1
原创 ETL必知必会----正则
ETL简介ETL(Extraction-Transformation-Loading)中文意思就是数据清洗(数据抽取、转换和加载),通俗的说法就是从数据源抽取数据出来,进行清洗加工转换,然后加载到定义好的数据仓库模型中去。目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。ETL是BI项目重要的一个环节,其设计的好坏影响生成数据的质量,直接关系到BI项目的成败。这...
2019-08-30 18:58:39
1250
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人