
商务智能BI---SQLServerBI
文章平均质量分 67
Cormier-an
且行且思
展开
-
数据仓库开始----范围的确定
数据仓库项目准备完毕后,接着就要考虑设置初始项目的范围。项目的范围需要 IT 机构与业务管理人员一起就进行确定。数据仓库项目范围应该在带给机构的价值与可管理性这两个方面都显得富有意义,避免过于考虑价值而忽略了可操作性。首轮设计开始阶段,应该将注意力集中在来自单个业务处理的数据上,这样可以尽快让用户看到初始原型,以便有进一步的功能需求。 对于那些更有挑战性的交叉处理项目,应该等到以后原创 2013-09-09 09:11:09 · 1043 阅读 · 0 评论 -
SQL Server 2005-同步复制技术:发布、订阅
SQL SERVER 2005 同步复制技术----发布订阅一、准备工作: 1.建立一个 WINDOWS 用户,设置为管理员权限,并设置密码,作为发布快照文件的有效访问用户。 2.在SQL SERVER下实现发布服务器和订阅服务器的通信正常(即可以互访)。打开1433端口,在防火墙中设特例 3.在发布服务器上建立一个共享目录,作为发布快照文件的存放目录。例如:在D盘根目录下建文件夹转载 2013-09-04 11:46:46 · 1178 阅读 · 0 评论 -
ETL----源业务系统数据库跟踪报告
一旦源系统被确定,就要说明这些系统的意义以及谁对他们负责。下图就是为这个目的建立的图表。这个图表,也就是源系统跟踪报告,使得我们不用总是麻烦系统管理员或者业务管理者。如果走运的话,数据建模工程师将开始制作这个列表。不管谁定的初稿,这个列表的维护应该是ETL小组和数据建模小组共同努力来完成。如果在分析过程中认为一个源系统不适合作为数据仓库的源,保留它在这个列表中,并说明不使用它的原因;可能在后续阶段原创 2013-10-07 15:26:13 · 1512 阅读 · 0 评论 -
BI通用流程的设计
BI流程:原创 2013-09-04 10:12:22 · 1914 阅读 · 0 评论 -
ETL----如何抽取变化的数据
在初始化加载时,捕获源数据中的数据内容的变化不是很重要,因为很可能会导出整个数据源或其中的一部分。然而一旦初始加载完成,捕获源系统中的数据变化立即变成非常重要的任务。如果等到初始加载完成才开始规划数据变化的捕获技术,则将遇到很大的麻烦,捕获数据变化绝不是一个简单的任务,必须制定相应的策略来在项目中捕获源数据中不断增长的变化。 ETL 小组在后续的加载过程中负责捕获数据内容的变化原创 2013-10-08 10:51:56 · 3405 阅读 · 1 评论 -
SQL Server 2008 - 第2章 创建、管理 数据库
第2章 创建数据库数据库是用来存储数据的空间,它作为存储结构的最高层次是其他一切数据库操作的基础。用户可以通过创建数据库来存储不同类别或者形式的数据。因此,在本章用户将详细地学习针对数据库的基本操作和数据库的日常管理操作,即如何创建数据库、对数据/日志文件进行操作、生成数据库快照等日常操作。本章学习目标:Ø 了解数据库对象及构成Ø 掌握创建数据库的两种方法Ø 掌握管理数据转载 2013-10-03 08:57:22 · 5948 阅读 · 0 评论 -
ETL----如何决定是否采用ETL工具
ETL工具还是手工编码(购买工具集还是自己写程序?) 在《智能企业》杂志的一篇精彩的文章(2003.5.31,Ralph Kimball编辑)中,Gary Nissen对这个问题总结概括后,回答是:“看情况”。我们展开来分析一下Gary的观点。 基于ETL工具的优势 根据某个ETL工具厂商的说法:“一个有价值的工具目的不在于能够解决琐碎的问题,而是要原创 2013-10-06 16:15:09 · 2715 阅读 · 1 评论 -
SSIS----改进数据流的性能
可以配置数据流任务的下列属性,这些属性都会对性能产生影响:为缓冲区数据(BufferTempStoragePath 属性)和包含二进制大型对象 (BLOB) 数据的列(BLOBTempStoragePath 属性)指定临时存储位置。默认情况下,这些属性包含 TEMP 和 TMP 环境变量的值。您可能希望指定不同或更快的硬盘驱动器上的其他文件夹来存放临时文件,或将它们分布在多个驱动器转载 2013-10-28 16:30:15 · 12114 阅读 · 0 评论 -
SSRS----添加计算字段,除数若为0的解决办法
SSRS开发报表添加计算字段时,当遇到除数为0的情形下,报表当中会显示: 错误号,非数字等提示,而并不是显示0如:添加计算字段表达式为: =Sum(Fields!消费.Value)/Sum(Fields!点击量.Value)当Sum(Fields!点击量.Value) 为0时便会出现上述情况解决办法如下: 报表设计面板,选择报表属性---代码-- 自定义原创 2013-11-07 09:27:29 · 3031 阅读 · 0 评论 -
SSRS----报表表达式、参数、变量使用
--在做点击流数据分析的过程中,有这样一种需求,参数选项可以设置不同度量,方法如下:--设定度量参数(下拉框)=IIf(Parameters!量值.Value =Switch(Parameters!量值.Value = 1, Sum(Fields!展现量.Value), Parameters!量值.Value = 2, Sum(Fields!点击量.Value),原创 2013-11-09 08:32:54 · 7624 阅读 · 0 评论 -
大数据分析流程
这篇文章来自一个公司内部的分享,是自己所服务的业务中数据平台的发展历程,已经讲了有几个月了,最近打算挑几个点拿出来用文章的形式写出来。是自己进入公司以来参与过或者接触过的数据型项目的情况。基本包含了业务数据分析的整个流程。这篇文章纯文字描述,没有任何图呵呵。所以看我需要耐心。1、最早的数据分析可能就报表目前很多数据分析后的结果,展示的形式很多,有各种图形以及报表,最早的应该是简单的转载 2014-06-12 11:10:17 · 1746 阅读 · 0 评论 -
SQL中全局变量
select @@CONNECTIONS--返回自上次启动以来连接或试图连接的次数。select @@CURSOR_ROWS--返回连接上最后打开的游标中当前存在的合格行的数量。select @@DATEFIRST--返回每周第一天的数字select @@ERROR--返回最后执行的SQL 语句的错误代码。select @@FETCH转载 2014-06-03 11:00:02 · 995 阅读 · 0 评论 -
判断数据变化的标准以及预测、异常预警
判断数据变化的标准以及预测、异常预警模型: 1均值一般采用平均数。如果有偏差非常大的异常值,即不仅超过此范围,并且是远远超出平如果均数很多的异常值,则均值采用中位数替代中位数即从小到大排序时第50%n 个数。如果n为奇数,则排序后第(n+1)/2个数即为中位数如果n 为偶数,则排序后第n/2个数和第(n/2+1)个数的平均数为中位数2趋势一般采用差额分析或者比率分析法,在时原创 2014-06-03 11:15:58 · 8544 阅读 · 1 评论 -
SQL Server 2008-数据仓库查询性能
SQL Server 2008数据仓库查询性能Sunil Agarwal and Torsten Grabs and Dr. Joachim Hammer 概览:星型联接查询优化分区表并行处理ROW 和 PAGE 压缩分区对齐的索引视图较前期同类产品相比,SQL Server 2008 将提供功能更为强大的关系数据仓库,但是您可能转载 2013-09-18 15:34:43 · 1626 阅读 · 0 评论 -
ETL----从源数据到数据仓库的逻辑数据映射
逻辑数据映射的组成 逻辑数据映射(见下图 )通常用一个表或者电子表格格式来表示,它包括以下特定的组成部分: 目标表名称:数据仓库中出现的物理表名称;目标列名称:数据仓库表中的列名称; 表类型:表示这个表是事实表,维表或者子维表(支节) SCD(缓慢变化维)类型:对维表,这个部分表示是类型1,类型2或者类型3的缓慢变化维。这个指标对维表中的不同的列可以是不同的。原创 2013-10-07 15:00:28 · 6610 阅读 · 0 评论 -
数据仓库成功的主要指标
数据仓库项目开始之前,为慎重起见,先花费一点时间评估一下继续行进所需要的机构准备情况。根据从开发实践中积累起来的经验,确定了五个用于区别能够平稳推进的项目与总是出问题的项目的因素。这些因素是衡量数据仓库成功与否的主要指标。虽然并不需要在项目推进过程的每个因素方面都取得高分,但是任何欠缺都意味着风险或者脆弱。1. 最为重要的因素是拥有精明强干的业务赞助人。业务赞助人应该对数据仓原创 2013-09-09 09:36:34 · 4118 阅读 · 0 评论 -
【转】微软工程师主讲的SqlServer2005视频教程
微软工程师主讲的SqlServer2005视频教程SQL Server 2005盛宴系列之一:SQL Server 2005产品简介http://download.microsoft.com/download/8/2/3/8230401d-2167-4731-bacb-c4c35cd91024/msft033006vxpm.zipSQL Server转载 2013-09-04 14:05:23 · 978 阅读 · 0 评论 -
SSIS备份并读取txt
1、 首先使用SSIS创建一个简单的Integration Services Project: File->New->Project->Business Intellegence Projects->Integration Services Project。2、 在编辑器的左边选择“Back Up Database Task”,拖到编辑器中。3、 在编辑器任意位置单击,在双击“Ba转载 2013-09-04 11:10:57 · 1136 阅读 · 0 评论 -
【转】SQL Server 2008数据仓库查询性能
SQL Server 2008数据仓库查询性能Sunil Agarwal and Torsten Grabs and Dr. Joachim Hammer 概览:星型联接查询优化 分区表并行处理 ROW 和 PAGE 压缩 分区对齐的索引视图 较前期同类产品相比,SQL Server 2008 将提供功能更为强大的关系数据仓库,但是您可能仍希望了解如何充分利用这项新转载 2013-09-04 14:16:59 · 2194 阅读 · 0 评论 -
sql2005/2008 删除过期备份
create proc sp_backupdatabase @bak_path nvarchar(4000)='' --备份路径;,@baktype int = null --备份类型为全备,1为差异备,2为日志备份,@type int = null --设置需要备份的库,0为全部库,1为系统库,2为全部用户库,原创 2013-09-04 11:50:24 · 951 阅读 · 0 评论 -
多维模型---不可累加度量(求和之外的度量聚合)
定义半累加性行为在很多业务方案中,半累加性度量值是非常常见的,它不在所有维度中统一进行聚合。 每个基于余额快照的多维数据集都会随着时间的推移而出现此问题。 您可以在用于处理证券、帐户余额、预算、人力资源、保险策略和法律事务以及很多其他业务领域的应用程序中找到这些快照。通过在多维数据集中添加半累加行为,可以为帐户类型属性的单个度量值或成员定义聚合方法。 如果多维数转载 2013-09-12 08:43:11 · 2921 阅读 · 0 评论 -
数据仓库建模--不同聚合方式(聚合函数示例)
使用聚合函数本主题包含在度量值中使用聚合函数(Sum、Min、Max、Count 和 Distinct Count)的示例。 查询示例与下列示例基于相同的多维数据集单元,以便可以查看更改函数的结果。这些示例使用的多维数据集有一个“销售额”度量值,它基于 Sales 事实数据表中的 Sales_Amount 列。 此多维数据集有三个维度:“客户”,转载 2013-09-12 08:56:58 · 2608 阅读 · 0 评论 -
日期维度上不能向上汇总的度量
Qing 20060927和阿龙探讨一个问题,其实已经不止一次地说起了。只是不知道该如何为他命名,差不多就是跟以前遇到的"通话用户数"问题类似,他这里是订购用户数。这个值,在不同时间粒度上,是需要去重计算的。例如下面一组数,想象这是一个用户订购表,每条记录表示用户发生了订购或退订,date表示日期,usr表示用户,act表示订购(s)/退订(u)。 date usr act转载 2013-09-12 09:09:14 · 1430 阅读 · 0 评论 -
数据ETL面临的问题----数据缺失
数据缺失的类型有:完全随机缺失(Missing Completely at Random,MCAR):数据的缺失与不完全变量以及完全变量都是无关的;随机缺失(Missing at Random,MAR):数据的缺失不是完全随机的,数据的缺失只依赖于完全变量; 完全非随机缺失(Missing Not At Random,MNAR):数据的缺失依赖于不完全变量自身原创 2013-09-12 09:44:10 · 4188 阅读 · 0 评论 -
网站流量统计分析---指标
网站流量分析 网站流量分析,是指在获得网站访问量基本数据的情况下对有关数据进行统计、分析,从中发现用户访问网站的规律,并将这些规律与网络营销策略等相结合,从而发现目前网络营销活动中可能存在的问题,并为进一步修正或重新制定网络营销策略提供依据。当然这样的定义是站在网络营销管理的角度来考虑的,如果出于其他方面的目的,对网站流量分析会有其他相应的解释。在商业行为的网站中,企业网站流量统计分析对原创 2013-09-16 15:26:50 · 6221 阅读 · 0 评论 -
建立数据仓库---- 聚集策略
聚集策略每个数据仓库都应该包含预先计算并预先保存的聚集表。如果给定了严 格避免出现混合事实表糙度的规则,期每个独特事实表聚集都应该拥有聚集 的物理事实表。在对事实进行聚集操作时,要么消除维度性,要么将事实与 堆租维皮联系起来。这些堆积形成的聚集维度事实表应该是与基本粒度事实 表棉联系的维皮压缩版本。这样,聚集维度表与基本维度表就能保持一致。考虑建立所有可能的聚集组合是不切实际的转载 2013-09-17 16:41:57 · 1768 阅读 · 0 评论 -
SQL Server 2008 Integration Services ETL 学习笔记
SQL Server 2008 Integration Services ETL 学习笔记转载 2014-08-01 10:37:41 · 1350 阅读 · 0 评论