
BI
文章平均质量分 56
微软BI套件,含ssis、ssas、ssra、mdx
soldierluo
羽毛球
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
《深入浅出统计学》读书笔记
前言大脑对于图像的理解效率,远远大于对文字的理解效率 图文结合比单纯的图像或者文字更容易被人理解与接受 统计是对大量信息的简化,化繁为简 统计的结果应以图像的方式表达出来,因为图像跟容易被人接受 统计的目的是为了获得某个结论,进而为决策服务数、数据、信息、知识、智慧1、数,1/2/3/4/5…..N,单纯的数字2、数据,1万元、2万元、3万元,数据(数字的依赖),是指带...原创 2019-09-23 11:35:49 · 1360 阅读 · 0 评论 -
EDW与维度模型间的抉择
EDW与维度模型间的抉择 1 EDW(enterprisedatawarehouse,企业级数据仓库),强调从源系统的业务与数据出发,在企业的的全局高度进行业务对象抽象,使其包含整个企业不同源系统的具体业务对象。1.1 采用雪花模型架构,设计上符合第三范式1.2 优点:统一规范1.3 缺点:复杂,开发周期长,成本原创 2017-10-16 21:11:22 · 2427 阅读 · 0 评论 -
MSBI表格模型与多维模型比较
MSBI表格模型与多维模型比较1、表格模型与多维模型是ssas服务下的两个不同产品2、它们不能直接相互转换表格模型1、表格模型的表之间的关系只能是一对多并且只允许单列关联, 没有一对一或者多对多, 也不支持自引用的关联关系.2、表格模型采用的是内存分析引擎, 相当于从磁盘中拷贝了一份数据到内存中,所以对内存要求比较大3、表格模型采用的是内存中列式存储技术, 这样能很大的提升查询的性能...原创 2020-01-14 18:07:59 · 2102 阅读 · 0 评论 -
如何控制SSRS报表中数据的访问权限
如何控制SSRS报表中数据的访问权限 1 建立用户与维度属性值间的关系表,refAccountDim,该表存储了用户能访问的维度的属性值,也即用户权限 2 SSRS中建立带有账号参数的共享数据集,该数据集根据传入的账号从refAccountDim表中查询该账号的权限并返回,如区域2.1 数据集输入参数为accountId2原创 2017-10-16 21:07:31 · 2103 阅读 · 1 评论 -
kettle安装使用与部署
kettle、etl原创 2022-07-21 15:00:18 · 2172 阅读 · 2 评论 -
BI学习计划
1 《数据仓库》——比尔.恩门,主要介绍什么是数据仓库2 SSIS设计与开发2.1 BIWORK的微软SSIS系列2.2 微软MSDN之SSIS系列3 SSAS设计与开发3.1 BIWORK的微软SSIS系列3.2 微软MSDN之SSIS系列4原创 2017-01-23 14:54:36 · 711 阅读 · 0 评论 -
BI导论——数据仓库概论
1 书名《Building the Data WareHouse》作者:比尔.恩门2 目的:将积累的数据变成信息,以建立决策支持系统(DSS)3 原有的DSS是分裂的,按需抽取的,导致重复与低效4 原始数据与DSS数据对比与差异4.1 原始数据4.1.1 面向应用,来自应用系统4.原创 2017-01-23 14:55:55 · 554 阅读 · 0 评论 -
MSBI实现用户的数据权限控制方法
如何控制SSRS报表中数据的访问权限1 建立用户与维度属性值间的关系表,refAccountDim,该表存储了用户能访问的维度的属性值,也即用户权限2 SSRS中添加相应的维度的共享数据集,如区域2.1 数据集输入参数为accountId2.2 数据集需关联refAccountDim表,以获取用户的数据权限2.原创 2017-01-23 15:51:38 · 1069 阅读 · 0 评论 -
finereport使用知识汇总
finereport使用知识汇总。原创 2025-05-29 14:56:35 · 234 阅读 · 0 评论 -
MS时序分析算法
MS时序分析算法它是针对连续值(如时间段内的销售额)进行预测的算法(其中包含多种优化后的算法)时序算法的输入输出为同一列时序模型中的重要算法参数 3.1. Periodicity_hint:该参数提供了有关数据模式重复频率的算法信息(以数据的时序的最小单位为基准,经过N个单位重复一次就设置为{n},如:以日为基准,周为循环的话就是{7},以月为循环就是{31},以周月为循环就是{7,3原创 2017-07-08 17:09:13 · 3504 阅读 · 0 评论 -
MS顺序与聚类分析算法
MS顺序与聚类分析算法 1. 它是结合了顺序分析和聚类分析的唯一算法,它是查找顺序中包含类似路径的事例的分类,也就是对相似顺序的事例进行分类。(此算法的可操作性似乎不强) 2. 分析模型的建立2.1. 数据准备,可以使用关联规则分析模型使用的数据2.2. 参考关联规则分析模型的建立,直到指定定型数据2.3.原创 2017-08-04 21:25:20 · 1115 阅读 · 0 评论 -
MS决策树分析算法
MS决策树分析算法决策树算法是分类和回归算法,用于对离散和连续属性进行建模,是一种混合算法。决策树根据朝向特定结果发展的趋势进行预测。如购买自行车案例中,10名年轻客户有9名购买,而10名老年客户只有3名购买,则算法推测年龄是购买自行车的关键预测因子。它通过在树中创建一系列拆分来生成挖掘模型,每当发现输入列与可预测列密切相关时,改算法吧便向该模型的树中添加一个节点。决策树与聚类算法的区别原创 2017-07-08 17:03:44 · 991 阅读 · 0 评论 -
MS聚类分析算法
MS聚类分析算法它是一种“分段”或“聚类”算法,以将示例分组到包含相似特征的分类中。它首先标识数据集中的关系,并根据这些关系来生成一系列分类,可以设置MiniMum_Support(分类的最小支持量)和Cluster_Count(大致分类数)来限制分类的数量它有两种分类算法,通过clustering_method属性来设置 3.1. K-means算法,每个数据点只属于一个分类 3.原创 2017-07-08 17:06:35 · 2652 阅读 · 0 评论 -
MS逻辑回归与MS线性回归算法
MS逻辑回归与MS线性回归算法 1. MS逻辑回归1.1. MS逻辑回归是MS神经网络算法的一个变种,有许多共性1.2. 逻辑回归的输入、输出、可为连续值与离散值,所以一般使用逻辑回归而非线性回归1.3. 回归算法是确定多个变量间相互依赖的定量关系的一种统计分析方法1.4. 逻辑回归模型的建立参考神经网络原创 2017-08-04 21:26:28 · 705 阅读 · 0 评论 -
MS神经网络分析算法
MS神经网络分析算法 1. 神经网络算法模仿人的神经网络的工作方式,神经网络由神经元组成,它由三层结构组成分为输入层、隐含层(负责逻辑与算法)、输出层,神经网络通过训练(学习)来调整各个神经元的参数,从而实现高的预测的准确性,所以又叫机器学习。 2. 原理是针对可预测属性的每个可能状态来测试输入属性的每个可能状态,并基于定型数据计算每个组合的概率。原创 2017-08-04 21:26:01 · 881 阅读 · 0 评论 -
MS关联规则分析算法
MS关联规则分析算法属于建议引擎算法,可根据已购买的商品推测出可能要购买的商品。关联规则是在大量数据事例中挖掘项集之间的关联或相关联系。典型如购物篮分析,就是购买了某一商品的用户是否会去购买另一商品。关联规则算法是Apriori算法的简单实现,下面是原理分析 3.1. 支持度:P(A∩B),既有A又有B的概率 3.2. 置信度:P(B|A),在A发生的事件中同时发生B的概率p(原创 2017-07-08 17:12:13 · 1502 阅读 · 0 评论 -
MS贝叶斯分析算法
MS贝叶斯分析算法它是一种基于贝叶斯定理的分类算法,有多个底层算法支撑,该算法运算量小,可以使用该算法进行初步探测,再根据结果使用更精确的预测算法。在给定可预测列的各种可能状态的情况下,贝叶斯算法将计算每个输入列的每种状态的概率。(非常重要的概念)贝叶斯算法的输入、输出都必须为二元值属性(是、否),其它所有类型都不支持。创建贝叶斯算法挖掘结构 4.1. 新增挖掘结构视图如下,因为之前原创 2017-07-08 17:08:11 · 796 阅读 · 0 评论 -
6.14、处理时间:PeriodsToDate、LastPeriods、ParallelPeriod
处理时间:PeriodsToDate、LastPeriods、ParallelPeriod 1 PeriodsToDate(level, member)在指定的级别内,返回级别第一个到指定成员间的所有成员,例:select { [Measures].[In Count] }on 0,原创 2017-03-02 17:59:58 · 868 阅读 · 0 评论 -
6.1、Cube(多维数据集)、tuple(元组)、member(成员)
Cube(多维数据集)、tuple(元组)、member(成员) 1 在OLAP服务中,cube是以多维空间的形式来呈现的,多维空间是由多个维度,也即多个轴来构成的,比如一维空间由一根轴构成,二维空间由两根轴构成,三维空间由三根轴构成,以此类推N维空间由N跟轴构成 2 在cube中,每一个维度的hierarchy【属性层次结构】都形成一个【轴】,原创 2017-03-02 17:26:59 · 913 阅读 · 0 评论 -
6.11、max、min、count、distinctCount、generate
max、min、count、distinctCount 1 Max(set [, expression])获取集合中的最大值withmember[Date].[Year Num].[max] as max( [Date].[Year Num].[YearNum].members )mem原创 2017-03-02 17:54:00 · 365 阅读 · 0 评论 -
6.12、层次结构导航
层次结构导航 1 访问层次结构中的其它成员1.1 Parent:父成员1.2 Children:所有子成员1.3 firstChild:第一个子成员1.4 lastChild:最后一个子成员1.5 siblings:所有兄弟成员1.6 firstSibl原创 2017-03-02 17:57:28 · 404 阅读 · 0 评论 -
6.13、旁系亲属与级别内导航
访问旁系亲属与级别内导航 1 访问旁系亲属1.1 Ancestor(member, level |distanct),访问某一层级的祖先成员1.2 Ancestors(member),返回成员的所有祖先成员1.3 Descendants(……),访问在指定级别或距离上的后代1.4 Cousin原创 2017-03-02 17:58:31 · 541 阅读 · 0 评论 -
6.15、同环比、累加、累加平均、滚动累加、滚动平均
同环比、滚动累加、滚动平均 1 同期与同比使用cousin和parallPeriod函数都可以获取到同期的成员,但是一般用cousin因为使用起来比较简单,示例withmember [同期] as ( cousin( [Date].[年-月-日].cu原创 2017-03-02 18:02:05 · 3287 阅读 · 0 评论 -
6.5、currentMember、properties、IIF、existing
currentMember、properties和existing 1 currentMember1.1 返回当前成员的引用,该函数应用于计算成员中1.2 访问方法:[dimension].[hierarchy].currentMember1.3 可通过该函数访问成员的属性1.3.1 currentMe原创 2017-03-02 17:37:09 · 871 阅读 · 0 评论 -
6.3、auto-exists、exists、non empty
auto-exists、exists、non empty 1 Auto-exists【自动匹配】当我们在使用crossJoin来关联两个集合时,不是两边所有的元组都能形成关联关系,这时,auto-exists就会自动判断其中的关联,将有关联的保留 2 Exists(setA, setB)返回在setA中与setB相关关联的那些setA的成原创 2017-03-02 17:32:07 · 527 阅读 · 0 评论 -
6.8、filter与nonempty
Filter过滤与nonempty非空函数 1 Filter(set, expression)返回表达式为true的成员的集合,类似于IIF,但IIF是针对单个成员的,而filter过滤集合中每一个成员。例:select { [Measures].[In Count],原创 2017-03-02 17:43:31 · 892 阅读 · 0 评论 -
6.7、order、范围操作、topCount、item
order、范围操作、topCount、item 1 Order(set, expression[,flag])Order函数根据表达式返回的值进行排序,如下select { [Measures].[InCount], [Measures].[OutCount]原创 2017-03-02 17:42:27 · 770 阅读 · 0 评论 -
6.4、calculate member【计算成员】的实现原理
Calculate member【计算成员】的实现原理 1 计算成员的使用与普通的层次结构成员一样,但它是基于普通层次结构成员计算得来,不保存在cube中 2 计算成员也必须依附于某一层次结构,也就是依附于某根轴上,如果没有指定则落在默认的度量值轴上 3 声明计算成员withmember [x] as1+2+3原创 2017-03-02 17:34:42 · 781 阅读 · 0 评论 -
6.6、计算成员避免无限循环与solve_order
计算成员避免无限循环与solve_order 1 Avoiding Infinite Recursion 避免无限循环计算成员如下:withmember [Date].[Month Num Of Year].[hours] as ([Hour].[HourKey].&[11])+([Hour].[Hour Key].&[12]) selec原创 2017-03-02 17:39:22 · 512 阅读 · 0 评论 -
Web连接cube,并将CellSet转成DataTable
Web连接cube,并将CellSet转成DataTable 1. 正常情况下我们使用ssrs连接cube,但是由于ssrs的局限性以及其它需求的存在,我们希望直接通过web应用程序来连接cube,就像直接连接sqlserver、oracle等数据库一样。 2. 如果要通过web程序连接ms的cube的话,我们需要通过一个额外的组件即ADOMD.NET来原创 2016-02-05 10:54:34 · 1554 阅读 · 0 评论 -
6.2、set、select、members、crossJoin
Set【集合】 1 Set【集合】由tuple【元组】组成,是一个或多个元组的集合,由【大括号】括起,逗号分隔,如:{ (tupleA), (tupleB), ………} 2 Set中每一个元组的成员都对应相同的层次结构,和相同的排列顺序,否则将出错,如: {原创 2017-03-02 17:29:39 · 386 阅读 · 0 评论 -
6.10、提取【extract】、与聚合【sum、aggregate、avg】
提取【extract】、与聚合【sum、aggregate、avg】 1 Extract(set, hierarchy[,hierarchy])从set中抽取轴(层次结构)形成新的局部元组,select [Measures].[In Count] on 0, //([Date].[Year Num].&[2016],[Date]原创 2017-03-02 18:05:31 · 448 阅读 · 0 评论 -
6.9、union、intersect、exception
复杂集合的处理union、intersect、exception 1 语法Union(set1, set2[,All]),返回两个集合合并后的集合Intersect(set1, set2[,All]),返回两个集合交叉部分的集合Exception(set1, set2[,All]),返回set1中与set2不交叉部分的集合 2原创 2017-03-02 17:45:10 · 335 阅读 · 0 评论 -
6.10、提取extract、与聚合(sum、aggregate、avg)
提取extract、与聚合(sum、aggregate、avg) 1 Extract(set, hierarchy[,hierarchy])从set中抽取轴(层次结构)形成新的局部元组,select [Measures].[In Count] on 0, //([Date].[Year Num].&[2016],[Date].[原创 2017-03-02 17:51:06 · 817 阅读 · 0 评论 -
5.2.4、SSAS-维度-多对多维度
维度——多对多维度的建立 什么是多对多维度? 我们正常遇到的数据结构是一对一,或者一对多的数据结构,也就是树形结构。但是现实中存在着多对多的结构,比如一笔销售来自一个店铺,但是一个店铺包含多个铺位,这时一笔销售就对应着多个铺位,而一个铺位又对应着多笔销售,这样就形成了多对多的关系。 多对多的关系需要用一个关系表来对关系进行维护,如下: 1 Di原创 2017-01-24 15:37:15 · 1395 阅读 · 0 评论 -
5.2.3、SSAS-维度-日期维度
维度-日期维度的建立 1 日期维度 日期维度存在于几乎所有的Cube中,它是最最普遍和最重要的维度之一。 要创建日期维度,首先需要创建一个日期维度表,并编写填充数据的存储过程。 日期维度表DimDate如下:drop table DimDatecreate table DimDate( DateKey int原创 2015-12-11 16:50:35 · 2702 阅读 · 1 评论 -
5.4.1、SSAS-创建度量
创建高级度量 1 聚合函数(累加、伪累加、非累加、半累加) 累加函数:父成员的值等于它所有子成员的值的总和,如SUM等 伪累加:伪累加不执行累加,它是按某种规则从子成员中取值,如MAX、MIN、AVG等 非累加函数:none与distinctCount函数 半累加函数:父成员的值等于子成员的值的总和,除非成员在时间的维度上。在时间维度原创 2015-12-11 16:51:49 · 1793 阅读 · 0 评论 -
5.4.3、SSAS-创建KPIs
创建KPIs 1 KIPs 关键绩效指标(Key performance indicators),人力资源管理中绩效管理模块的重要内容!用于测定业务绩效的可计量度量值。 2 Scope,指定MDX语句的作用域限制于指定的子多维数据集 3 KPI一般用户进行绩效考核,所以要进行考核需要几个要素3.1原创 2015-12-11 16:53:00 · 1810 阅读 · 0 评论 -
5.7、安全与部署
安全与部署 1 实施安全 可对Server、Database、Cube、Dimension、Cell等,各级数据进行访问控制1.1 在控制面板中添加系统用户或组1.2 在AS服务器中添加上面的用户和组打开AS服务器-》右键服务器-》属性-》安全性-》将上面的用户和组添加为“服务器管理员”1.3原创 2015-12-11 16:54:20 · 577 阅读 · 0 评论 -
5.2、SSAS-维度-基本知识
维度-基本知识 1 维度,由维度属性、属性层次结构和属性关系组成。 维度属性:可定义维度中的实际数据(比如,产品维度重大名称属性记录产品的名称,型号属性记录其型号) 属性层次结构:用来定义用户浏览维度的方式(比如,日期维度中,年、月、日属性,年是月的上层,月是日的上层,这样就可以进行数据的钻取) 属性关系:维度中的属性始终与键属性直接或间接相原创 2015-12-11 16:48:31 · 2862 阅读 · 0 评论