商业智能(BI)架构

===========================================================

企业能否成功地应用商业智能取决于两个因素:第一,是否有正确的数据,亦即数据是否完整、准确、一致、及时的数据;第二,是否有将数据转换为决策信息所需的工具和手段。要解决这两个问题,需要有一定的体系结构和支撑技术。

商业智能的体系结构简述如下:


1. 数据源系统:包括前后端OLTP On-Line Transaction Processing, 在线事务处理)、电子商务系统和外部信息提供者等等。这些不仅是数据源,而且是知识和行动的操作对象。

2. 商业智能工具系统:包括数据仓库模型和构造工具、访问工具、决策支持工具OLAP 和数据挖掘工具。

数据仓库模型和构造工具

包括ETLExtract / Transformation / Load)工具和数据仓库模板、元数据交换、联合数据仓库和数据集市系统。这些工具用于从操作系统和外部数据源系统中捕捉数据,经过数据加工和转换,最后将数据装载进全局的或部门的数据仓库。

访问工具

包括应用接口和中间件,需求驱动数据的获得和分析,决策引擎的模型、规则和度量等,使得客户工具能够访问和处理数据库和文件系统中的商业信息。数据库中间件允许客户透明地访问后台各种异构的数据库服务器,Web 服务器中间件允许Web 客户连接到数据库中。这些产品用于管理终端用户感兴趣的商业信息。一般采用三层信息存储,最高层次是数据仓库,数据仓库中集成了全企业的商业信息;中间级是部门数据仓库,又叫做数据集市,这里存储了某个商业单位、用户组或部门的商业信息,这些数据集市可以直接建立在企业操作系统的基础上;

结构的最低层次存储了根据用户和应用需求经过裁剪后的信息。

决策支持工具OLAP 和数据挖掘工具

包括了从基本查询和报表工具到先进的在线分析处理再到信息挖掘工具的各类工具。所有工具都支持GUI 客户界面。许多也可以在Web 界面上使用。现在,这些工具大多设计成能处理数据库产品来的结构信息,但是将来需要对文件系统、多媒体、甚至邮件或Web 服务器上的复杂的和非结构的信息。

3. 商业智能应用系统

包括人力资源管理、分析和报告、财务管理、客户资源管理、分析和报告供应链管理、企业计划管理的分析和报告。这些应用是许多针对不同行业或应用领域经过裁剪的完整的商业智能解决方案软件包。很多信息管理系统构建在相对分散的体系结构上,企业的各个部门都是一个个信息孤岛,彼此之间的信息很难共享。为了获得真正智能化的企业管理,信息结构必须与商业智能无缝集成。

4.知识和行动应用系统

包括企业知识管理门户、商业信息和建议和知识行动。BI 软件提供商通常提供一个单一的、基于网络的入口门户来提供报告、OLAPOn-Line Analysis Processing)和数据挖掘信息。这些入口与企业信息门户(EIPEnterprise Information Portal)不同,通常是不被用户直接访问的。

通过向最流行的通用EIP 提供连接来实现BI 的应用,使其成为一个企业全面信息管理中的关键组成部分。

三、商业智能的支撑技术

商业智能的支撑技术主要由数据仓库(DW)、在线分析处理(OLAP)以及数据挖掘(DM)三部分组成。

1.数据仓库

数据仓库是商业智能的基础,许多基本报表可以由此生成,但它更大的用处是作为进一步分析的数据源。所谓数据仓库就是面向主题的、集成的、稳定的、不同时间的数据集合,用以支持经营管理中的决策制定过程。多维分析和数据挖掘是最常听到的例子,数据仓库能供给它们所需要的、整齐一致的数据。

为了有效地进行数据管理,企业往往需要将各地的数据汇总到总部,并建立一个庞大的数据仓库。这种数据仓库不但能够保存历史数据、阶段性数据,并从时间上进行分析,而且能够装载外部数据,接受大量的外部查询。

建立数据仓库的过程一般包括抽取操作数据,按要求设定自动程序以定时抽取操作数据并自动更新数据仓库,预先执行合计计算等步骤。

快速、简单、易用的查询和报告工具能够帮助管理者充分利用企业中不同层次的数据,获取所需要的特定信息,并以合理的格式加以显示。同时,优秀的工具支持多种网络环境,允许用户在客户机/服务器网络、内部网络或Internet 上传输分析结果。它们还应该有足够的灵活性,以支持各种类型的查询和报告需求,从简单的订阅、周期性的报告,到使用SQL 和其它查询语言作随机查询。

2. 在线分析处理(OLAP 在线分析处理是一种高度交互式的过程,信息分析专家可以即时进行反复分析,迅速获得所需结果。在线分析处理同时也是对存储在多维数据库(MDD)或关系型数据库(RDBMS)中的数据进行分析、处理的过程。这种分析可以是多维在线分析处理、关系型在线分析处理,也可以是混合在线分析处理。

3. 数据挖掘

数据挖掘是从浩瀚如海的数据和文档中发现以前未知的、可以理解的的信息的过程。由于数据挖掘的价值在于扫描数据仓库或建立非常复杂的查询,数据和文本挖掘工具必须提供很高的吞吐量,并拥有并行处理功能,而且可以支持多种采集技术。数据挖掘工具应该拥有良好的扩展功能,并且能够支持将来可能遇到的各种数据(或文档)和计算环境。

四、商业智能解决方案在企业经营中的作用

商业智能技术正是一种能够帮助企业迅速地完成信息采集、分析的先进技术。它包含了决策过程中所有的查询和报告、在线分析处理(OLAP)和信息采集应用程序及工具。 商业智能解决方案在企业经营中的作用主要表现在三个领域:

1、市场营销关系(Relationship Marketing: 通过有效的交流和良好的服务维持客户对企业来讲是至关重要的。商业智能通过帮助企业完成客户划分、客户获得、交叉销售、客户保留等工作,使企业的目标、人员、商务处理流程和基础设施集中到根据客户的需要来定制产品、服务以及"面对面"的客户交流方面。

2、可赢利性分析:商业智能解决方案可以帮助企业分析利润的来源、各类产品对利润总额的贡献程度、广告费用是否与销售成正比等等。

3、减少成本:商业智能技术能够协助企业确定在哪些对业务影响最小的领域减少成本。而降低成本的决策可基于详细的目标数据。

五、商业智能的应用

商业智能已应用于许多领域。其中部分应用列举如下:

1 零售业

商业智能在零售业中有如下一些应用:

预测:对需求进行预测,根据预测结果更好地管理库存。

营销:对顾客数据进行分析,从而不仅了解卖掉了什么,同时了解“谁”买了什么,实现由消费者“拉”动的营销。

产品销售模式:某种产品的销售特点,不同产品之间的关联关系,作为进货和商店布局的参考。

2)保险业

商业智能在保险业中有如下一些应用:

理赔分析:根据险种、保单持有人、理赔类型以及其它特征分析理赔趋势,以确定准备金的数量,理赔分析可以帮助识别保险欺诈。

顾客利润率分析:分别按不同的品种、不同的地区、不同的代理人、不同的客户群的服务的成本和所得到的收益进行量化分析,找出利润率差异的原因,以利用开发新品种、对于已有品种进行客户化改进并识别能带来高利润率的顾客。

客户价值分析:顾客利润率不是评价顾客对于保险公司价值的唯一指标,也许一个顾客具备在将来购买高利润率保险产品的潜力,也许会成为很好的高利润率顾客的介绍人,因此要考虑顾客在与保险公司打交道的整个过程中的价值。

客户划分:将有各种共同特征的客户划分为不同的客户群,掌握其需求和产品的使用模式,以分别确定营销方案;分析委托人的利润率,识别机会,改进服务。

风险分析:了解引入新险种和发展新客户的风险。识别高风险客户群和能带来机会的客户群,减少理赔频率。

3 金融和证券业

商业智能在金融和证券业中有如下一些应用:

顾客利润率分析:了解各个顾客在当前的和长远的利润率。使尽量提高对于高价值顾客的销售,减少用于低价值顾客的成本。

信用管理:了解各种产品的信用状况,建立不同顾客群的信用模式,及早帮助顾客避免信用问题的发生,预测信用政策变化所产生的影响,减少信用损失;

4 电信业

商业智能在电信业中有如下一些应用:

用户划分:分析用户使用电信产品的历史数据,进行用户呼叫行为分析,提供个性化服务和有效的激励手段;

需求分析:分析用户各种产品使用及其花费数据,深入了解顾客对于新产品和服务的需求,对于通信网络投资、定价和竞争性进行分析。

5 制造业

商业智能在制造业中有如下一些应用:

市场营销:提供面向顾客的交易数据,实现由消费者“拉”动的营销;

预测:(同零售业);

采购分析:掌握供应商的成本、供货及时性等因素;

HomeAboutDesignlol.netAdmin ARCHIVED ENTRIES FOR 数据可视化 九 27 前言:数据可视化是怎样创造出来的。可视化 Tags: 数据可视化, 信息可视化 13 Comments » 我多次被炫目的数据可视化或信息可视化震惊,在我知道这些图片背后的数据来源和创造历程后,更是为之诧异不止。它涉足制图学、图形绘制设计、计算机视觉、数据采集、统计学、图解技术、数型结合以及动画、立体渲染、用户交互等。相关领域有影像学、视知觉。空间分析、科学建模等。 这是创造性设计美学和严谨的工程科学的卓越产物。用极美丽的形式呈现可能非常沉闷繁冗的数据,其表现和创作过程完全可以称之为艺术。所以我翻译了来自SM上的3篇数据可视化和信息图形的文章,主要是鉴赏并提供一些参考资料。我尽量查找了每张数据图表背后的背景,添加了标注和说明,希望那个帮助读者更深入地理解这些图表所呈现的含义,而不仅仅是停留于对“好看”的赞叹上。这些图片不会说话,但它们比文字和语言都更为有力。 数据可视化 Data Visualization 和信息可视化 Infographics 是两个相近的专业领域名词。狭义上的数字可视化指的是讲数据用统计图表方式呈现,而信息图形(信息可视化)则是将非数字的信息进行可视化。前者用于传递信息,后者用于表现抽象或复杂的概念、技术和信息。 而广义上的数据可视化则是数据可视化、信息可视化以及科学可视化等等多个领域的统称。 数据可视化起源于1960s计算机图形学,人们使用计算机创建图形图表,可视化提取出来的数据,将数据的各种属性和变量呈现出来。随着计算机硬件的发展,人们创建更复杂规模更大的数字模型,发展了数据采集设备和数据保存设备。同理也需要更高级的计算机图形学技术及方法来创建这些规模庞大的数据集。随着数据可视化平台的拓展,应用领域的增加,表现形式的不断变化,以及增加了诸如实时动态效果、用户交互使用等,数据可视化像所有新兴概念一样边界不断扩大。 而我们熟悉的那些饼图、直方图、散点图、柱状图等,是最原始的统计图表,它们是数据可视化的最基础和常见应用。作为一种统计学工具,用于创建一条快速认识数据集的捷径,并成为一种令人信服的沟通手段。传达存在于数据中的基本信息。所以我们可以在大量PPT、报表、方案以及新闻见到统计图形。 但最原始统计图表只能呈现基本的信息,发现数据之中的结构,可视化定量的数据结果。 面对复杂或大规模异型数据集,比如商业分析、财务报表、人口状况分布、媒体效果反馈、用户行为数据等,数据可视化面临处理的状况会复杂得多。 可能要经历包括数据采集、 数据分析、数据治理、数据管理、数据挖掘在内的一系列复杂数据处理,然后由设计师设计一种表现形式,是立体的、二维的、动态的、实时的还是允许交互的。然后由工程师创建对应的可视化算法及技术实现手段。包括建模方法、处理大规模数据的体系架构、交互技术、放大缩小方法等。动画工程师考虑表面材质、动画渲染方法等,交互设计师也会介入进行用户交互行为模式的设计。 所以一个数据可视化作品或项目的创建,需要多领域专业人士的协同工作才能取得成功。人类能够操纵和解释如此来源多样、错综复杂跨领域的信息,其本身就是一门艺术。 数据可视化在发展过程中,科学和工程领域的应用衍生出了分支:科学可视化——“利用计算机图形学来创建视觉图像,帮助人们理解科学技术概念或结果的那些错综复杂而又往往规模庞大的数字表现形式”。 在计算机诞生之前,科学的可视化行为就存在。如等高线图、磁力线图、天像图等等。利用计算机的强大运算能力,人类可以使用三维或四维的方式表现液体流型、分子动力学的复杂科学模型。 比如利用经验数据,科学可视化在天体物理学(模拟宇宙爆炸等)、地理学(模拟温室效应)、气象学(龙卷风或大气平流)模拟人类肉眼无法观察或记录的自然现象;利用医学数据(核磁共振或CT)研究和诊断人体;或者在建筑领域、城市规划领域或高端工业产品的研发过程中发挥重大重用。比如汽车的研发过程中,需要输入大量结构和材料数据,模拟汽车在受到撞击时如何变形。在城市道路规划的设计过程中,需要模拟交通流量。 虽然科学可视化的表现形式对于普通人比较陌生,像粒子系统、散点图、热力图等图表不接受专业训练很难看懂。但实际上科学可视化的成果已经渗透到我们生活的每个角落。 90年代初期,信息可视化领域进入人们的视野。用于解决对异质性数据中“抽象”的部分的分析。帮助人们理解和观察抽象概念,放大了人类的认知能力。 科学可视化和信息可视化的差别比较微妙,因为科学可视化的大部分处理对象都是抽象的概念。在手段和技术上也有大量共同之处。所以边界比较模糊。 在国外,许多大型企业、科研机构都会有相关部门进行数据可视化研究,如数字图书馆。媒体和政府机构也会对自己掌握的数据进行可视化分析,如犯罪地图。在互联网上,那些掌握了大量用户活动信息、用户关系网或语料库的网站,比如digg,friendfeed,flickr或大型电子商务网站等,都有实验性的可视化项目。可惜在中国在这方面的商用或实验项目还是比较空白的。 数据可视化的开发和大部分项目开发一样,也是根据需求来根据数据维度或属性进行筛选,根据目的和用户群选用表现方式。同一份数据可以可视化成多种看起来截然不同的形式。 有的可视化目标是为了观测、跟踪数据,所以就要强调实时性、变化、运算能力,可能就会生成一份不停变化、可读性强的图表。 有的为了分析数据,所以要强调数据的呈现度、可能会生成一份可以检索、交互式的图表 有的为了发现数据之间的潜在关联,可能会生成分布式的多维的图表。 有的为了帮助普通用户或商业用户快速理解数据的含义或变化,会利用漂亮的颜色、动画创建生动、明了,具有吸引力的图表。 还有的图表可以被用于教育、宣传或政治,被制作成海报、课件,出现在街头、广告手持、杂志和集会上。这类图表拥有强大的说服力,使用强烈的对比、置换等手段,可以创造出极具冲击力自指人心的图像。在国外许多媒体会根据新闻主题或数据,雇用设计师来创建可视化图表对新闻主题进行辅助。 说了那么多,大家都可以感受到数据可视化所应用价值,其多样性和表现力吸引了许多从业者,而其创作过程中的每一环节都有强大的专业背景支持。无论是动态还是静态的可视化图形,都为我们搭建了新的桥梁,让我们能洞察世界的究竟、发现形形色色的关系,感受每时每刻围绕在我们身边的信息变化,还能让我们理解其他形式下不易发掘的事物。 我通过翻译这系列的文章,为数据可视化的创造力所折服,也为其所能诞生和发展的背景环境所感叹。希望国内能有更多的跨领域人才的教育背景,能有发展实验性项目的环境,设计师们能拥有更多的创造力和专业素养,永远保持好奇心和敏感。 数据可视化相关的引擎/程序/工具(来自wiki百科) Instantatlas Data Desk DAVIX Eye-Sys Ferret Data Visualization and Analysis GGobi IBM OpenDX IDL (programming language) Style Intelligence OpenLink AJAX Toolkit ParaView Smile (software) StatSoft Visifire VisIt VTK Yoix Prefuse 信息可视化的相关方法 Cladogram (phylogeny) 分支图 Color alphabet 色彩字母表 Dendrogram (classification) 树状图 Information visualization referen
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值