写在前面
5月18日,选型直播曾做过一期题为“移动+社交时代,如何治理大数据洪水?”的节目,在那期节目中,Informatica北方区总经理李晨先生系统地介绍了Informatica公司的背景、大数据治理的完整框架,以及最新的“智能数据湖”解决方案。
节目播出后,大家反响非常热烈,但又感觉意犹未尽。毕竟,关于数据的话题实在是太多,而一期节目的容量又非常有限。
为了弥补大家的遗憾,我们这次又特意请来了Informatica大中国区的首席架构师但彬先生,和大家接着聊数据和数据管理的话题。
如果说上期节目是对数据治理的一次全景展示的话,那么,这期节目但总将为大家切一些近景,带我们看看金融、教育、医疗、电力、航空等典型行业的典型用户,他们是怎么用数据管理工具激活企业数据价值的。
古人说:他山之石,可以攻玉。借鉴同行们的成功案例,是提高我们自身的数据治理水平的最简单、最有效的方式。
下面,就让我们一起来听,选型宝首席架构师李维良与Informatica大中国区首席架构师但彬的精彩对话吧。
李维良(主持人)
在数据管理这个大概念下,有哪些细分领域?在每个细分领域中,Informatica又布局了哪些产品?
但彬
我们常说IT(Information Technology信息技术),其中一半是I,也就是信息,尤其在今天,数据和信息变得越来越重要。从数据库(Database)到数据仓库(Data Warehouse)和数据挖掘,再到今天的大数据(Big Data)和数据治理,数据管理的概念一直在变化和延伸,而Informatica则一直是这一领域的辛勤耕耘者。
大家最初认识Informatica,大多是从Power Center和Power Exchange这样的数据集成软件开始的,认为它只是一个ETL工具。而今天,经过近25年的不懈努力,Informatica已经建立起了从智能数据平台到数据管理解决方案,从数据集成到数据质量管理、大数据管理、云数据管理等的完整的数据管理框架和产品线。
我们的数据管理框架分为三层。最下面是支撑层,称为 “ 智能数据平台 ”。为什么这样说呢?因为其中应用了很多AI(人工智能)技术,比如数据模式识别,它会智能地区分出,哪些是客户数据,哪些是交易数据。平台层通过企业级统一元数据管理、人工智能、数据监控、管理与计算等功能,为产品和解决方案提供统一的支撑。
在平台层之上,是产品和解决方案。这其中,除了经典的数据集成、数据归档、数据质量管理、数据安全、主数据管理等,我们近年来又不断推出了很多新的产品和解决方案,比如:企业信息目录(EIC),以及面向数据交换的DIH(Data Integration Hub)、面向流式数据处理的IIS(Informatica Intelligent Streaming)等。再比如,数据湖和数据治理在几年前还只是概念,现在也都被产品化了(IDL和Axon)。
李维良
您刚才提到了主数据、元数据、大数据、ETL等,请您先为大家普及一下这些基本概念。
但彬
在这几个概念中,大数据(Big Data)可能是大家了解最多的,它的特征可以用几个V来概括:Volume(大量)、Velocity(高速)、Variety(多样)、Va