
OLAP
expleeve
当我看到现在身边的人时,我在想,自己是不是该专注于某件事了
展开
-
多维建模和MDX中出现的一些概念
Microsoft SQL Server Analysis Services 多维数据集是基于度量值、维度和维度属性来组织的。下表说明了使用 MDX 表达式语言所需了解的维度建模术语和概念。 “(全部)”成员 ((All) member) “(全部)”成员是属性层次结构或用户定义的层次结构中的所有成员的计算值。 属性层次结构 “属性层次结构”是包含以下级别的属性成员层次结构:翻译 2012-10-10 16:16:30 · 1791 阅读 · 0 评论 -
Junk Dimension vs Degenerate Dimension
Junk Dimension A junk dimension is a convenient grouping of typically low-cardinality flags and indicators. By creating an abstract dimension, these flags and indicators are removed from the fact ta原创 2014-01-10 09:00:44 · 1310 阅读 · 0 评论 -
大数据分析(Big Data OLAP)引擎Dremel, Tenzing 以及Impala
对于数据分析师来说,SQL是主要的语言。 Hive为Hadoop提供了支持SQL运行的能力,可是目前Hive运行速度达不到实时要求。这是因为Hive将SQL翻译成一个或多个MapReduce任务,而MapReduce原本是大数据批处理计算框架,并不适应实时数据分析的速度要求。 现在有两种思路去提高SQL在大数据平台上的执行速度:1. 用一种更快的SQL执行引擎取代MapRed转载 2013-02-25 15:00:22 · 1084 阅读 · 0 评论 -
大数据下的数据分析平台架构
随着互联网、移动互联网和物联网的发展,谁也无法否认,我们已经切实地迎来了一个海量数据的时代,数据调查公司IDC预计2011年的数据总量将达到1.8万亿GB,对这些海量数据的分析已经成为一个非常重要且紧迫的需求。作为一家互联网数据分析公司,我们在海量数据的分析领域那真是被“逼上梁山”。多年来在严苛的业务需求和数据压力下,我们几乎尝试了所有可能的大数据分析方法,最终落地于Hadoop平台之转载 2013-02-25 14:44:25 · 658 阅读 · 0 评论 -
Mondrian的Evalutor算法过程
主要包括三个步骤:1. 先解析各轴,把各轴上的元素记录下来2. 在缓冲中查找元素的值,没有的话记录下来3. 对记录下来的未找到的元素向下层请求数据原创 2013-01-05 10:28:36 · 1096 阅读 · 0 评论 -
Mondrian中Schema解析流程
一、解析XML生成Schema每个RolapConnection有一个RolapSchema,创建RolapConnection时,会自动调用RolapConnection的构造函数,通过RolapSchema的load方法,传入Catalog的XML形式的Schema,使用org.eigenbase.xom.XOMUtil创建一个XML的解析器,将XML传入解析器,返回一个DOMWrappe原创 2012-12-31 10:29:42 · 1822 阅读 · 0 评论 -
MDX函数解析计算过程_Mondrian笔记
1、组成部分a) mondrian.olap.fun定义了mdx内置的函数集,包括函数的name、signature、description和flags,其中flags一般有三个以上的字母,分别代表了函数的语法类型(在Syntax中定义)、返回类型(Category中定义)、参数类型(Category中定义)。这种函数继承至FunDefBase类。b) 用户自定义的原创 2012-12-27 15:36:54 · 1926 阅读 · 0 评论 -
Mapping MDX To SQL Statements
SELECT CROSSJOIN ({Access, Word}, {Kansas, Buffalo, Topeka, USA, Canada}) ON COLUMNS, {[1994].Qtr1.MEMBERS, [1994].Qtr2, [1994].Qtr3, [1994].Qtr4.MEMBERS} ON ROWSFROM SalesCubeWHERE (Sal翻译 2012-12-11 10:39:29 · 1080 阅读 · 0 评论 -
OLAP的基本概念
维(Dimension)人们观察数据的特定角度,是考虑问题时的一类属性,属性集合构成一个维。e.g:时间维、地理维等。维的层次(Hierarchy)人们观察数据的某个特定角度(即某个维)还可以存在细分程度(即粒度)不同的各个描述方面。e.g:时间维:日期、月份、季度、年。维的级别(Level)每个层次中包含若干个级别,即细分的程度。e.g:时间维原创 2012-10-11 11:15:20 · 1041 阅读 · 0 评论 -
其他汇总的实现
SUM COUNT AVG DISTINCTCOUNT MAX MIN 使用一个类似[Measures].currentMember.aggType的属性with member [DIM].[MEM] ascase when [Measures].currentMember.AggType = 'sum' then Aggregate([A原创 2014-05-26 23:01:00 · 615 阅读 · 0 评论