企业信息集成(EII)解释

        我们知道如何与数据库、数据集市和数据仓库打交道,因为在这些地方的信息是被仔仔细细地结构化和管理着。但是公司还需要与大量非结构化信息打交道,如来自文档库、电子数据表格、电子邮件和即时传信档案、电子记录以及可以公开获得的网页和商业信息服务等。
  对此,有两点是关键。第一是内容的非结构化本质:各机构必须处理可能看上去是随机的文本流,而不是我们所习惯的“正常”受管理数据中经仔细描述和确认的字段。第二点考虑是公司从企业内外部多个来源获得这些信息。每种数据都有其自己的组织和格式,而且多数是为单一的独立目的设计的,不是集成的数据集合的一部分。因此,这些数据仓库倾向于相互独立、不容易在一起工作。
  我们正依赖于数量不断增加的数据来源,并需要在新的数据来源一出现就能利用它们,而不必重新编写应用程序和工具。
  对此问题的简单回答是将所有数据聚合在单一的通用数据库或数据仓库中。可惜,建立这样的集中式数据储存库是一个很慢、很费钱的过程。维护和更新这样的储存库更是件让任何IT管理者都会做恶梦的工作。况且我们还没有涉及到可扩性和谁拥有信息这样的问题。很明显,我们需要更好、更高效的策略。
  企业信息集成(EII)是一个大题目,而这样的策略就属于这个大题目之下。但是,解决此问题的方法已经以各种不同的名称存在多年。今天,下列三个主要因素使此情形更易管理:越来越多地使用和接受XML作为跨平台的标准;更便宜、容量更大的存储与更快、更强大的处理器结合;直接解决此问题的新工具涌现。
  EII产品能更广泛地将不同来源的数据在需要时结合起来。这是通过建立中间数据服务层(中间件)实现的,这个中间层允许以一个标准化的方式存取数据,而不必直接与每个分开的后端数据源打交道。
  EII比传统的EAI(企业应用集成)更是面向服务。
  XML可能是今天推动EII发展的最大单一因素,因为XML给予我们在生成时或者在以后给数据打标记的能力——不管是为格式还是为内容、或者同时为两者打标记。这些标记可以扩展和修改,以适应几乎所有的知识领域。同时考虑到微软公司已经宣布,它有意使XML成为Office后续者默认的保存格式。除了XML,EII应用程序今天通常是围绕元数据库和具体的连接器构建的,以连接这些储存库。
  为使EII实用,它不能简单地只是另一个数据仓库。相反,它必须在需要时以一种及时的和特定的方式将信息弄到一起。对企业而言实现的最简单方法,是建立和维护一个元数据库或详细的目录,由它来描述能得到哪些数据、是如何储存的、位于何处以及数据之间的关系等内容。 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值