
数据分析与数据挖掘
文章平均质量分 56
OnlyQi
我是一只蜗牛
展开
-
数据分析和数据挖掘的区别
Data analysis -- is a process of inspecting,cleaning, transforming data.The goal is to highlight useful information,suggesting conclusions, andsupportingdecision making.Data Mining-- Intersection o原创 2013-02-26 15:24:53 · 1903 阅读 · 0 评论 -
Introduction to the SQL Server Analysis Services Logistic Regression Data Mining Algorithm
一个step by step的演示如何使用VS创建 SQL Server Analysis Services逻辑回归数据挖掘算法项目的文章。https://www.mssqltips.com/sqlservertip/3471/introduction-to-the-sql-server-analysis-services-logistic-regression-data-mining-alg转载 2016-01-03 21:28:27 · 914 阅读 · 0 评论 -
SSAS快速入门
本文是基于下面文章写成的: http://blog.sina.com.cn/s/blog_b82e70870101h3cb.html 文中作者一步步创建了SSAS项目,但是并没有具体介绍涉及的数据仓库概念。本文补充了这些概念,学习时应结合起来看。创建数据源数据仓库的数据来源往往是关系型数据库,因此需要建立到数据库的链接,以便将数据从数据库导入数据仓库。 数据源的建立就是告诉SSAS项目:使用的原创 2016-03-03 10:04:10 · 6289 阅读 · 0 评论 -
微软BI解决方案概述
微软的BI解决方案由一系列的组件构成:SSIS(SQL Server Integration Service)SSIS是一个ETL工具。一个BI项目面临的第一个问题就是如何将多个异构数据源的数据整合到一起,这也是SSIS解决的第一个问题。SSIS可以很方便的从FTP,普通txt文件,access 等数据源读取数据,并将数据整合到一个统一的地方(通常是关系型数据库)。SQL Se原创 2016-03-07 18:42:34 · 4082 阅读 · 0 评论 -
数据预处理
在数据挖掘中有一个重要步骤,数据预处理。因为现实世界中的数据存在各种各样的质量问题:不完整(缺少某些重要属性,或仅仅包含聚合值),含噪音的(包含错误或存在偏离期望的离群值),而且是不一致的(例如用于商品分类的部门编码存在差异)。数据清理就是填写缺失的值,光滑噪音数据,识别或删除离群点并解决不一致性来清理数据。数据清理在数据挖掘中很重要的原因在于,质量低下的数据会大大降低数据挖掘原创 2012-09-17 16:46:55 · 1095 阅读 · 0 评论 -
数据仓库和数据集市的区别和联系
主要区别是:Data Warehouse:1,一般先于数据集市被创建出来。2,多种不同的数据来源,3,包括所有详细数据信息。4,数据内容为公司级别,没有特定主体或领域。5,符合第三范式。6,通常需针对如何处理海量数据做优化。Data Mart:1,一般后于数据仓库被创建出来。2,数据仓库为数据来源.3,包含适度聚合的数据和一些详细数据,4,数据内容为部门级别,有特定的领域...原创 2016-03-07 17:09:47 · 4645 阅读 · 0 评论 -
数据仓库的星形和雪花模型
本文是这篇文章的摘录:http://www.oracle.com/webfolder/technetwork/tutorials/obe/db/10g/r2/owb/owb10gr2_gs/owb/lesson3/starandsnowflake.htm什么时候使用雪花模型?Ralph Kimball,数据仓库大师,讲述了三个例子。对于下面三个例子,使用雪花模型可能是更好的选择。1,一个用户维度表...原创 2016-04-10 11:01:28 · 2534 阅读 · 0 评论 -
数据仓库中的慢变化维度和快变化维度
数据仓库中的事实表总是在变化中,通常是新的业务数据不断装载入DW。事实表数据的增加是正常现象,也无需特别处理。但很多时候维度表的数据也会发生变化,且维度表的数据变化会导致维度表和事实表的关系发生变化。因此对于维度变化,该如何设计维度表,是本文要讨论的问题。例如一个订单事实表和一个客户维度表,每个订单有一个对应的客户。在今年5月17日之前,客户维度表中某客户的类别是corporate,5月18日原创 2016-04-08 14:11:15 · 10627 阅读 · 0 评论