- 博客(132)
- 收藏
- 关注

原创 使用SQL Server Analysis Services数据挖掘的关联规则实现商品推荐功能
假如你有一个购物类的网站,那么你如何给你的客户来推荐产品呢?这个功能在很多电商类网站都有,那么,通过SQL Server Analysis Services的数据挖掘功能,你也可以轻松的来构建类似的功能。 将分为三个部分来演示如何实现这个功能。1.构建挖掘模型2.为挖掘模型编写服务接口3.开发简单的前端应用4.使用Excel进行关联商品分析5.组织数据并用Excel
2013-02-25 02:00:30
1637
原创 Power BI八年回望记
本人从事BI,数据仓库领域相关工作15个年头,这15年目睹了这个方向从火爆到逐渐被大数据领域不断吞食。中间零散关注Power BI好长时间,也算目睹了它的成长。那天在网络上搜索power bi,无意搜索到我在2013年写过的文章。那个时候还叫Power BI for Office 365,微软还在Office产品线上不断的去做尝试。如今随着微软产品线的调整,它的名字也彻底变了。回望这八年,能看到的是power bi确实是进步了不少,正在逐步拉近跟Tableau的距离,但也正如我那段时间总结:感觉
2020-12-11 00:48:16
381
原创 Data Vault玩转数据仓库(三)
在Data Vault 2.0版本里,其不只是针对数据仓库的建模,同时也包含了架构,方法论以及实现。这篇挑几个概念,附上我个人对其的理解。同时也把这个系列的名字改成《Data Vault玩转数据仓库》。ETL和ELTELT火了有段时间,百度上高雅的介绍很多,不扯别的,咱直接来点俗的:- E就是抽取,数据从源系统进入到数据仓库的过程。- T是指转换,类型转换,计算什么的都算在内。- L加载,把结果加载到数据仓库里。- E和L可能从汉语的角度看有些像,如果说区别的话就是前者...
2020-09-13 16:28:05
392
2
原创 Data Vault玩转数据仓库(二)
写在前面本篇先不讨论Data Vault其本身,因为不见得所有人都接受这个。但是里边有一些很不错的东西跟主流的数据仓库方法是有共同点的,所以这里主要讨论这些共同的方法,在笔者看来,无论是Kimball还是DV,这些方法都是很有用的。这个系列为作者本人哥本哈士奇的个人理解和总结,可能会有理解上的偏差,也欢迎大家一起来讨论。哈希计算常用的哈希计算,HASH KEY, HASH FULL, HASH DIF,这里会有简单的介绍。关于如何做哈希计算,可以参考这个链接:https://www.
2020-09-13 16:27:14
441
原创 Data Vault玩转数据仓库(一)
简介国内关于Data Vault的信息很少,所以决定写点什么,纯粹都是自己在这个行业10多年的摸爬滚打。不过为了效率,尽量做到简短,直接上干货。对于各个细节大家有不同的理解欢迎来讨论。数据仓库建模的方法有哪些。首先最经典的是数据仓库Inmon基于3NF的方法。这个方法知道概念的人很多,但是实际用的很少,也不建议你去了解更多,因为目前在国内的招聘网站上你会很少找到这个。其次是Kimball的维度建模方法,这个基本上做过数据仓库的都用过,比如事实表和维度表,基于这种理论也可以构建数据立方体.
2020-09-13 16:26:10
596
原创 数据仓库上云那些事儿
数据仓库上云已经不是什么新鲜概念,这里简单聊一聊在这个过程中需要考虑的问题。首先,某些话题不是一两句能说清楚,所以,这里我们不聊以下话题:技术平台的对比。这里我们不做任何对比分析,如不特殊说明均指Azure以及微软相应的产品。 某个产品的好坏。 法务,合规。不同公司有不同的规定。 国家大事。这个我们知道就好,不在这里聊。但是我想强调一点是,即使只搞技术,国家民族大义也是头等大事,不然你会吃亏。上不上云To be or not to be, this is a question..
2020-09-13 16:24:08
637
原创 My year of 2017
有一个姓罗的胖子,他说他有一个要坚持20年计划,第一年我真的不觉得什么,好比每天晚上都要刷牙每天早上都要吃早饭一样简单。实际几年走下来之后,发现能坚持下来真不是一件容易的事情,生活中总会有各种各样的事情发生,可能这一年之中的某一件事就让你彻底失去了动力和信心。不过,忘记了是谁说过,有些事情一个人如果不经历的话就永远成长不起来。所以有时候要感激生活对我们的各种磨难,跌倒了,有勇气爬起来才有可能继续勇
2018-01-28 22:45:07
348
原创 My year of 2017
有一个姓罗的胖子,他说他有一个要坚持20年计划,第一年我真的不觉得什么,好比每天晚上都要刷牙每天早上都要吃早饭一样简单。实际几年走下来之后,发现能坚持下来真不是一件容易的事情,生活中总会有各种各样的事情发生,可能这一年之中的某一件事就让你彻底失去了动力和信心。不过,忘记了是谁说过,有些事情一个人如果不经历的话就永远成长不起来。所以有时候要感激生活对我们的各种磨难,跌倒了,有勇气爬起来才有可能继续勇
2018-01-28 22:34:20
286
原创 ETL开发面试问题加吐槽加职业发展建议
作为甲方,对于乙方派来的开发人员,我是会自己面一下。总体来说遇到的水平不一,于是经过这三年多的面(cui)试(can),总结了一套自己的面试套路,中间也遇到过很多想吐槽的东西,于是大概记录了下来。在后面, 也写了些关于这方面的职业发展和我个人的建议。
2017-04-30 19:52:51
1617
原创 My year of 2016
2016, year of excellence. Year of happiness. In Beijing we can also find some happiness which is same as hometown. Year of family. Always have a feeling of family, no matter wher
2017-01-01 14:50:49
645
原创 几张图片总结我的2015年
经过一年多的摇号,自助商品房终于中签,年初,房子选型。 当时还是一个大坑。 现场选房,在1000多号中排325号,基本上还占据着选择的主动权。 2015MVP Open Day,SQLServer方向的就我们两个人,还记得当时大家聚在一起针对微软的各种吐槽。 当时三个活动赶上一起了,选房,open day和Daimle
2016-01-30 21:10:14
430
原创 Hadoop单机模式安装-(1)安装设置虚拟环境
网络上关于如何单机模式安装Hadoop的文章很多,按照其步骤走下来多数都失败,按照其操作弯路走过了不少但终究还是把问题都解决了,所以顺便自己详细记录下完整的安装过程。此篇主要介绍如何在Windows环境下设置虚拟机环境以及一些准备工作,熟悉WMware的朋友可以略过。我所记录的笔记适合没有Linux基础的朋友跟我一起操作,同时欢迎高手参观指导。
2015-07-05 21:01:14
854
原创 Datazen地图Chart介绍
本篇主要介绍Datazen对于地图图表的支持,这里你可以看到Datazen目前所支持的地图图表类型,以及其自带的地图数据。
2015-06-22 11:15:34
1023
原创 TFS Express backup and restore
When we setup source control server, we should always make a backup and restore plan for it. This article is to describe how to backup and restore a TFS Express instance from one server to another server.
2015-06-16 22:47:30
1013
原创 [BI项目记]-BUG处理
BUG是在项目过程中以及运维过程中经常遇到的工作项。在处理每一个BUG的过程中,通过项目管理系统把BUG相应的内容纪录下来也是很重要的。这里将介绍如何通过TFS来完成BUG的处理工作。
2015-06-09 20:50:34
823
原创 [BI项目记]-BUG创建
BUG是在项目过程中以及运维过程中经常遇到的工作项。在处理每一个BUG的过程中,通过项目管理系统把BUG相应的内容纪录下来也是很重要的。这里将介绍如何通过TFS来完成BUG的创建工作。
2015-06-09 20:49:42
729
原创 [BI项目记]-DB脚本同步
BI项目中会有很多不同种类的项目,其中比较比较大的一部分就是对DB脚本的处理。然而DB的脚本毕竟无法在项目中进行维护,所以这里介绍如何对DB的脚本进行版本上的维护。
2015-06-02 22:31:40
838
原创 [BI项目记]-搭建代码管理环境之创建团队项目
此篇主要介绍如何基于TFS环境创建团队项目来进行项目代码的版本管理工作,这一系列将侧重于BI项目,当然对于其它项目也同样适用。
2015-06-01 16:58:19
811
原创 [BI项目记]-文档版本管理笔记
代码的版本管理程序员们有专门的工具,那么作为项目管理人员如何进行文档版本的管理呢,此篇介绍如何通过SharePoint进行文档版本管理。
2015-06-01 16:57:19
828
原创 [BI项目记]-搭建代码管理环境之云端
这一篇主要介绍云端的TFS。微软在云端解决方案为我们提供了不错的选择,当本地的资源无法满足部署一个TFS的环境的时候,在互联网连接允许的情况下,可以考虑使用Visual Studio Online。
2015-06-01 16:56:21
1404
1
原创 [BI项目记]-配置Sharepoint2013支持文档版本管理笔记
做开发或者做方案,写文档是很重要的一个工作,我们经常需要知道文档被修改的次数,谁在什么时间修改的文档,以及在某一个版本中,都修改了哪些内容,以及不同版本的文档之间有什么差别。
2015-05-31 21:39:19
818
原创 SQL Server Database 维护计划创建完整的备份策略
SQL Server的维护计划Maintenance Plan是一个非常实用的维护工具,可以完成大多数的数据库维护任务,通过对这些功能的封装,可以省去很多的代码编写时间。网络上完整介绍的不是很多,特此补上一篇。
2014-10-26 20:55:04
1198
翻译 SSAS下玩转PowerShell(三)
在第一篇中简单介绍了PowerShell,包含基本的一些命令,以及如何打开PowerShell,并且导航到SSAS对象。第二篇中学习了如何使用变量根据当前日期创建SSAS备份,以及如何运行MDX和XMLA脚本。
2014-09-01 20:39:29
885
翻译 SSAS下玩转PowerShell(二)
上一篇中简单的介绍了SSAS下的PowerShell,这一篇会演示更多的操作,比如根据当前时间创建备份,使用变量去指定处理哪一个分区,以及用XMLA脚本去创建分区,和在PowerShell中调用PowerShell脚本。
2014-05-25 17:35:15
793
翻译 SSAS下玩转PowerShell
操作SSAS数据库的方法有很多,是否有一种可以方法可以通过脚本自动去做这些事呢,比如处理分区,创建备份以及监视SSAS的运行状况。
2014-05-24 23:43:08
913
原创 再谈通过http访问SSAS
在有些场景下,数据中心会分为不同的服务器场:数据库场和应用程序场。服务器场间有严格的防火墙控制,其中数据库场只能建立从应用程序场的防火墙穿越,也就是说不允许任何客户端直接连接到防火墙。 这种策略对于数据库引擎来说没什么问题,但是对于分析服务来说就被完全限制住了,通常我们都是通过Excel直接连接分析服务数据库的,并且通过分析服务的角色来控制对数据的访问权限。那么是否有什么方法可以解决这个问题呢?
2014-04-29 22:44:30
1075
原创 如何在 SSAS服务器之间做同步
从SQL Server 2005开始,分析服务就支持了同步的功能。本文将介绍如何在SQL Server 2012下同步Adventureworks的分析服务数据库。通过同步的功能,我们就来可以弥补分析服务在差异备份以及全量备份上的不足,从而间接的实现类似故障转移这样的功能。
2014-04-20 23:08:38
904
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人