
商业智能之路
文章平均质量分 67
专注于商业智能(BI)、企业绩效管理(EPM)领域
JBean
专注于商业智能BI和企业绩效管理EPM领域--jbean.org
展开
-
商业智能只是一种解决方案
每个企业面临的数据环境、业务内容和决策需求都是不同的,因此,商业智能(BI)不是一种确定的技术,更不是一个或一套具体软件,而是针对每个企业的实际情况而规划与构建的数据分析和决策辅助解决方案。原创 2013-08-15 13:05:08 · 2820 阅读 · 0 评论 -
传统企业开展数据分析工作缺什么?
在传统行业的企业里,虽然对在管理与经营决策中应用数据分析手段越来越受到重视,但是与互联网公司相比,传统企业数据分析应用的深度和效果还远远不够。那么在传统企业里开展数据分析到底缺少什么呢?原创 2013-08-13 13:23:08 · 2039 阅读 · 3 评论 -
商业智能简史( A History of Businesss Intelligence)
商业智能简史( A History of Businesss Intelligence)是 Information Builders公司制作的一张图,原文链接已失效。有人评价说该图做的很漂亮,但远远达不到“商业智能行业年鉴”的标准,还有人指出BI行业的一些关键事件、产品、技术和厂商被遗漏。商业智能简史转载 2013-08-07 22:33:24 · 1715 阅读 · 0 评论 -
商业智能给数据获取带来的局部效益案例
商业智能到底能给信息获取工作带来多少实际价值呢?我们往往只是根据调研情况和实践经验进行粗略估算,能够获取准确统计数据的情况不多,现以其中一个项目为例,说明BI/DW项目实施前后获取数据的成本和时间变化。原创 2013-08-05 09:13:18 · 1603 阅读 · 0 评论 -
亚马逊推荐系统神话般60%转化率的背后
分析师苏察瑞塔•穆尔普鲁称,在某些情况下,亚马逊网站推荐的销售转化率可高达60%。可是微博等途径传播时省掉“在某些情况下”这一前提,疯吹“亚马逊推荐系统的转化率高达60%,它清楚消费者的喜好,可以预测出消费者的需求进行推荐形成购买,而目前国内的电商大都未能做到如此程度”。亚马逊推荐系统转化率很高是广为认可的,可是神话般的60%转化率,却源自片面取样,无可否认在某些情况下可以高达60原创 2013-08-05 09:09:45 · 2529 阅读 · 0 评论 -
MDX示例:求解众数(mode)
在统计学中,众数(Mode)是样本观测值在频数分布表中频数最多的那一组的组中值,主要应用于大面积普查研究之中,众数在一组数据中可能会有好几个。简单的说,众数就是一组数据中占比例最多的一个或几个数。原创 2013-07-29 09:23:59 · 1814 阅读 · 0 评论 -
MDX示例:求解中位数、四分位数(median、quartile)
采集获取知名招聘网站上的求职和招聘信息并通过商业智能开展职业职位供求及趋势等相关统计分析。何用MDX求解薪水中位数、四分位数(Median,Quartile)等。原创 2013-07-26 16:30:14 · 6112 阅读 · 0 评论 -
ETL问题解答-SSIS文件操作、Excel转PDF、Zip压缩等
ETL文件操作常见问题解答,包括SSIS文件复制、文件移动、文件重命名、SSIS中将Excel文件转PDF文件、在SSIS中根据系统当前时间动态设置文件名、SSIS Zip文件压缩等原创 2013-07-24 08:36:32 · 2291 阅读 · 1 评论 -
ETL问题解答-用SSIS将表导出到文件
问题: 百度商业智能贴吧的网友“花不完的幸福”提问: 数据库中有很多很多表,现在要求将其中四个表的数据导出到本地,本地文件命名要用表名+导出时间,我现在很纠结了。第一点:要用一个包实现四个表导出,怎么做?无头绪第二点:怎么才能指定本地文件名呢?还要用导出时间作为后缀的。例:table :abc 导出后为:abc_201206030950.txttable :ef 导出后为:ef原创 2013-07-24 08:31:47 · 1640 阅读 · 0 评论 -
增量ETL数据抽取的策略及方法
这是很久以前在处理增量时的老文章,近年实施大量项目中的经验处理方式是往往不得已时才采取增量处理的方式。而更多采用的方式是严格控制操作数据窗口,在满足业务限制及分析需求的前提下力求数据更新窗口最小化,这种最简单的策略反而被证明是一种简单、快速、高效的做法。原创 2013-07-21 16:23:57 · 3471 阅读 · 2 评论 -
数据仓库维度模型粒度提升情况浅析
维度建模时,力求在数据仓库中记录最明细粒度的数据,以保证完整记录业务发生的事实,从而满足日后面临不同分析需求时能够对数据进一步加工利用。可在商业智能项目中往往还需要更高粒度的数据,这时就会面临维度模型粒度提升的情况。原创 2013-07-20 11:34:14 · 1742 阅读 · 1 评论 -
图形展示ACCENT原则及失败案例解析
数据可视化图形展示的目的是向用户有效传递数据中所表达的信息,因此图形展示绝不是美化数据报表的手段,而是从数据到信息的辅助转化手段。图形展示要向用户清晰的传达并使其理解数据所包含的信息,必须达到准确、易理解、直观、清晰等基本要求。原创 2013-07-19 13:17:13 · 2083 阅读 · 1 评论 -
开源XMLA客户端访问组件介绍
XMLA已经成为访问OLAP多维数据的事实标准,几年前本人曾对SSAS的XMLA做过系统介绍。在定制开发的BI商业智能项目或使用部分OLAP特性的项目中,客户端通过XMLA访问OLAP多维数据是一种较为方便的做法,尤其当应用系统的技术架构与OLAP的技术环境差异较大时,比如:在J2EE的应用程序里访问微软SSAS。作为本博客里涉及XMLA的最后一篇文章,本文将介绍几种比较好用的开源XMLA客户端访原创 2013-07-19 12:10:55 · 2251 阅读 · 1 评论 -
大数据概念炒作周期模型
Gartner咨询机构指出2013年将是大数据盛行的一年,在新兴技术概念炒作周期中Gartner认为大数据在不久将进入“泡沫幻灭期”(Through of Disillusionment),Gartner还给出了2012版的大数据概念炒作周期模型(Hype Cycle for Big Data)。原创 2013-07-13 19:56:44 · 2428 阅读 · 1 评论 -
数据分析方法之分解分析介绍
在BI系统中,分解分析是结合结构分析与因素分析的一种可视化的数据分析方法,它可通过用户交互式的分析操作过程,构造出树形的分解结构,并结合80/20原理图来展现因子的数据分布情况。分解分析可用于分析KPI指标的构成因子及其贡献度。数据分析之分解分析在分解树节点上可显示多种信息,如指标的数值、占比、对比值、趋势、预警等。在对分解分析进行可视化实现时得出的经验是最多同原创 2013-07-13 18:58:29 · 1916 阅读 · 1 评论 -
哪种数据仓库架构最成功?
在BI/DW领域中,围绕“哪一种数据仓库架构(Data Warehouse Architecture)最佳?”的争论一直没有休止,这个问题同时也是企业在建立DW时需要决策的关键问题。Bill Inmon的集线器架构/企业信息工厂架构(Hub and Spoke / CIF – Corporate Information Factory)与Ralph Kimball的数据集市/数据仓库总线架构(Da原创 2013-06-25 18:06:18 · 2614 阅读 · 0 评论 -
广告传媒业营销商业智能的分析内容
在广告传媒公司,营销及销售部门负责公司媒体的各项广告经营活动,包括:组织市场分析、调研,制定公司营销战略规划,组织制订、分解、落实年度广告销售计划和目标市场广告销售计划,组织及落实广告媒体宣传活动、推广策划、媒体发布及使用状况的监督等各项媒体维护计划,培育、开拓经营网络,洞察、预测渠道危机,及时改进完善,进行广告代理合作项目洽谈,处理协调广告代理合作相关事宜,组织建立客户关系库,形成与客户定期沟通原创 2013-06-21 14:00:59 · 1881 阅读 · 0 评论 -
人口和生育信息统计分析BI系统简介
我国正处在人口转变、经济转轨、社会转型、结构调整的关键时期,人口与经济社会形势变化加快,变数增多,现有的人口宏观信息在数量和质量上难以完全满足人口与发展战略研究、制订发展规划及宏观决策的需要。本省人口总数多,人口流动频繁,外来人口众多,区域之间人户分离现象严重,跨区域婚嫁情况复杂,这对人口计生规划统计和信息化工作提出了新的挑战。因此,充分提高人口和计生信息统计与分析工作的信息化水平,充分利原创 2013-06-21 14:02:24 · 2499 阅读 · 0 评论 -
BI项目之报表复杂度评判标准乱弹
给一家外资金融公司做BA,协助BI项目的筹备与招标,包括内部业务需求调研与整理、内部方案建议、项目招标RFP文件撰写以及后继的项目监理等工作。刚开始接手工作,就接到一堆所谓的“报表”,其实是来自高管、市场、销售、运营、财务、风险等部门的报表和分析需求,包括报表、多维分析、图形、仪表盘、打印标签等等,唯一没有包含的只剩风险数据挖掘那部分需求。总部要求立刻将报表按照复杂度进行分类,要有标准化的原创 2013-06-29 16:50:40 · 1831 阅读 · 1 评论 -
BI系统中的分析流程解析与示例
一个应用效果良好的BI商业智能系统,应该在其使用过程中,针对各个分析主题有效的组织相关分析内容,不但能够提供用户所需分析内容,还应尽量向用户呈现出数据分析人员日常分析问题的思维流程。分析流程(又叫做分析线索)负责组织分析主题中的多个分析对象(KPI关键绩效指标、Dashboard部件、报表、分析报告、分析表格、分析图形、挖掘步骤及可视化结果等)的实体,它包含在分析主题。分析流程是指导用户针原创 2013-06-20 19:49:10 · 3857 阅读 · 1 评论 -
从用户角度看BI系统中数据分析模型的层次
在BI商业智能系统中,面向分析的数据模型一般是多维数据分析模型,分析模型由相应分析领域的分析维度(见附1)和分析指标(见附2)组成。针对面向不同层级用户的需求,分析模型按照分析的粒度划分为不同的层次,这里以面向高层管理人员宏观管理及决策分析需求、面向中层管理人员及业务人员的日常经营分析及业务跟踪与监控需求为例,仅将分析模型划分为“经营层次的分析模型”、“管理层次的分析模型”两个层次。1原创 2013-06-19 21:28:45 · 3330 阅读 · 0 评论 -
BI系统的应用组织思路与数据分析模式
BI商业智能软件一般都会提供若干数据整合、数据查询、分析与评价、数据可视化及数据分享的手段,但是在BI项目的构建与实施过程中,如果不按照一定的应用组织思路、数据分析模式及分析流程使用这些工具或手段,呈现给最终用户的将是独立的工具集和离散的分析内容,BI系统的整体应用效果将大打折扣。同时,最终用户也了解数据分析模式及数据分析流程方面的一些常用理论和方法,以便形成自己的分析内容组织思路,从而有效开展数原创 2013-06-17 17:06:00 · 2768 阅读 · 0 评论 -
BI商业智能项目中的若干风险要素
BI商业智能项目应在 “业务驱动,总体规划,统一设计,分期实施” 的总体设计原则下分期实施,采取Agile BI方法论迭代开展,先确保核心功能满足客户需求,在总体规划下不断完善整个系统,以提高可交付性并降低风险。以下总结了以往多年在商业智能项目(BI/DW项目)实施中遭遇的一些典型风险因素。1) BI项目的目标及需求范围不确定,或者项目目标没有在用户方相关业务环节关键管理原创 2013-06-17 17:01:51 · 2001 阅读 · 0 评论 -
集团财务分析BI项目中的财务系统环境
我国集团化经营模式起步较晚,集团管控模式及管控力度各异,集团范围内财务信息化水平及统一程度不尽相同,因此在实施集团财务分析一类的BI商业智能项目的过程中,在不同的集团之间遇到的财务系统及核算数据环境也各不相同,初步归纳一下有如下几种模式。1、 集中模式在总部集中式部署一套集团财务核算系统(SAP R/3,Oracle EBS,NC,EAS等),集团版的财务核算系统提供企业原创 2013-06-17 16:59:48 · 2529 阅读 · 0 评论 -
BI商业智能项目遭遇之怪象
作为一个在商业智能领域苦逼十几年的从业人员,每天实现着各种的BI系统,接触形形色色的行业和业务、林林总总的数据与分析,未免枯燥。今天就来闲谈一下在BI项目中的一些遭遇吧。有一客户联系到我们,面谈时提及他们已经购买了来自几大厂商的3套BI平台,可是至今仍然没有可以使用的分析内容,因此要求我们卖给他一个ETL工具,能够立刻见效的提取所需要的数据并形成让他们满意的分析内容。我想了解他们打算面原创 2013-06-15 10:42:49 · 1365 阅读 · 0 评论 -
商业智能之内存分析(In-Memory Analytics)技术
传统的商业智能工具在分析时是从存储在磁盘中的数据库、数据仓库或OLAP中获取数据;而顾名思义,基于内存分析(In-Memory Analytics)技术的商业智能工具则是从内存中直接获取分析数据:数据被预先载入内存,用户在执行查询及后继分析时,均直接从内存中获取所需数据。基于内存分析(In-Memory Analytics)技术的商业智能工具极大的提高了查询及分析的执行效率,可获得良好的交互及时性原创 2009-06-22 10:27:00 · 1668 阅读 · 0 评论 -
BI项目中数据库服务器硬件性能估算示例及问题
参照搜集的相关资料, 在项目中对数据库服务器硬件的进行性能估算。因为对硬件选型不是很在行,感觉问题不少。1.TPCC值估算在性能估算中,我们对系统上线后的运行状况做以下假定:l 系统同时在线用户数为250人(U1);l 平均每个用户每分钟发出4次访问请求(N1);l 系统发出的业务请求中,查询、统计各占2/5,更新占1/5,其中:a.平均每次查询业务产生8个事务(T1)原创 2008-10-23 22:40:00 · 1828 阅读 · 0 评论 -
数据仓库成熟度模型
转自:商业智能翻译小组-蔡旭 (欢迎各位同仁加入商业智能翻译小组)简介作为国际上比较权威的商业智能机构TDWI提出了数据仓库成熟度模型,描述一个企业商业智能发展的阶段和特点。文中对各阶段使用的技术的优缺点进行了比较和推荐,非常有实用价值。我们中的许多人都曾经多年从事数据仓库管理工作。有些人做出了战略性的系统,让用户和企业高管十分满意。有些人则在为维持企业持续投入支持数据仓库项目挣扎,同转载 2009-04-29 21:15:00 · 1699 阅读 · 1 评论 -
数据挖掘概念综述
一、什么是数据挖掘1.1、数据挖掘的历史近十几年来,人们利用信息技术生产和搜集数据的能力大幅度提高,千万万个数据库被用于商业管理、政府办公、科学研究和工程开发等等,这一势头仍将持续发展下去。于是,一个新的挑战被提了出来:在这被称之为信息爆炸的时代,信息过量几乎成为人人需要面对的问题。如何才能不被信息的汪洋大海所淹没,从中及时发现有用的知识,提高信息利用率呢?要想使数据真正成为一个公司的资源原创 2008-10-28 15:55:00 · 2224 阅读 · 0 评论 -
创建和使用SQL Server SSAS本地多维数据集
Microsoft SQL Server SSAS的本地多维数据集(即Local Cube,也叫脱机多维数据集)和本地挖掘模型(Local Mining Models)允许在客户端机器上脱机执行离线分析(多维分析与数据挖掘),从而对有离线分析要求(能够在断开网络连接的情况下脱离SSAS服务器进行数据分析)的软件开发提供了一种备选手段。原创 2013-07-03 23:32:45 · 4521 阅读 · 1 评论 -
在Visual Studio 2012中开发SQL Sever BI项目
微软SQL Server附带的BI开发工具(如SQL Server 2005/2008/2008R2 中的Business Intelligence Development Studio,SQL Server 2012中的SQL Server Data Tools)都是基于Visual Studio框架,可是Sql Server 安装的 Visual Studio都比当前发行的主流的Visual原创 2013-06-23 20:06:27 · 3848 阅读 · 3 评论 -
SSAS2005/2008中自定义MDX语句模板的使用
MDX语句的编写不但需要具有多维度思考的能力并了解上下文处理方式,而且因为成员名称的冗长而显得复杂。在SQL Server Management Studio及SQL Server Business Intelligence Development Studio中 ,附带了用于许多常见任务的模板,但是模板的真正作用在于它能为必须频繁创建的复杂脚本创建自定 义模板。在本练习中,您将创建带有较原创 2009-02-13 02:05:00 · 2001 阅读 · 0 评论 -
SSAS2008 Dev Studio项目降级为SSAS2005项目的方法
Abstraction: Downgrade Dev Studio projects from SSAS 2008 to SSAS 2005本文给出SSAS2008 Dev Studio建立的项目文件降级为可以在SSAS2005 Dev Studio中使用的项目的方法。并指出了若干SSAS2008中新增、但却不被SSAS2005所支持的特性。step1、设置SSAS2008项目的部署版原创 2009-01-15 19:30:00 · 1030 阅读 · 0 评论 -
SSAS命名计算的SQL语法需遵循"源"数据提供者的要求
在SSAS数据源视图中,命名计算是一个表示为计算列的 SQL 表达式。使用命名计算,可以扩展数据源视图中现有表或视图的关系架构,而无需修改基础数据源中的表或视图。有些初学者看到命名计算一般是在SSAS的DEV Studio中定义的,很容易误解命名计算的SQL语法应符合SSAS(也就是sql server)支持的范围。而实际上并非如此,这一点如果了解数据源视图的性质及作用后即可熟悉。同时,也原创 2008-12-01 17:54:00 · 1475 阅读 · 0 评论 -
MDX示例:统计各产品每个季度的销售排名
ITPUB数据仓库与数据挖掘论坛用户Damon__Li问:统计各种产品在本年每个季度的销售排名,(现在有日期、产品维度和销售额度量)大体显示如下 Q1 Q2 Q3 Q4 销售额 排名原创 2013-06-19 22:37:01 · 2571 阅读 · 5 评论 -
一些常用的MDX查询语句(基于SSAS 2008)
说明:本文提供了一些常见的MDX查询语句示例,供有兴趣者作为学习MDX的参考。由朋友Junes原创,在此首发。环境:SSAS2008及Codeplex的Adventure Works2008示例DW/OLAP目录:1. 指标分段统计2 .查询成员属性3. 在MDX查询语句中调用VBA函数4. 按成员属性对指标进行分段或分类统计5. 指标排名原创 2009-02-07 21:13:00 · 1742 阅读 · 0 评论 -
复杂或有趣的MDX问题求解(5)- 测量值的条件格式化
在某些情况下, MDX查询中单一测量值的格式不是唯一的,也就是说测量值在不同的情况下需要设置并显示为不同的数据格式或展示格式。问题描述有一个计算成员 [Stat OB Report] 定义如下 Case When [DimIntegrate].[DI_AttributeName].CurrentMember IS [DimIntegrate].[原创 2008-11-20 15:30:00 · 1612 阅读 · 0 评论 -
复杂或有趣的MDX问题求解(4)- 求过去12个月的销售总额
在业务中经常要求不但需要知道指标的当月表现,而且需要知道近期的趋势,一般是通过对该指标过去12个月的表现来实现的。问题描述以一个超市的洗衣粉销售为例,有如下的实事表: 品名(productName) 单价(unitPrice) 数量(qty) 日期(年月) ...... ...... 立白 4.0原创 2008-11-11 14:01:00 · 1974 阅读 · 0 评论 -
复杂或有趣的MDX问题求解(3)-SQL查询事实表与MDX语句查询的关系示例
SQL SUM事实表成员列和MDX成员查询之间的关系如何呢?根据维度层次的定义关系,及成员在层次中的位置,情况有很多种。优快云的boa_bi提了一个问题,是SQL、MDX关系的简单的一种。问题描述:如果简单的这样写 with member [Measures].[a] as ([Measures].[Store Sales]+[Measures].[Store Cost])*[Meas原创 2008-11-04 19:26:00 · 1998 阅读 · 0 评论 -
复杂或有趣的MDX问题求解(2)-根据客户上期表现求本期、本年的表现
2. 根据客户上期表现求本期、本年的表现Question: 以上月销售额达成情况按照区间划分的方式对客户进行分类统计;并对每个区间的客户,求其本月、本季度及本年度的销售额、客户数、平均销售额。要求的结果样式为:(月份是动态的) 允许结果为以下样式: 当前月份: 2008年9月 Answer:TBD.原创 2008-11-04 08:39:00 · 1759 阅读 · 3 评论