
数据分析/挖掘
文章平均质量分 78
jwisdom
目极世间之色,耳极世间之音,身极世间之鲜,口极世间之潭,思极世间之道,悟极世间之理。
展开
-
“水煮”数据仓库(摘自it专家网)
就在前几天,一位用户参加某企业的应聘面试,他所应聘的是该公司的DBA,负责的方向是数据分析,此公一路过关斩将,甚是顺利。直到面对公司的负责人。这位负责人只给他出了一道面试题:谈一谈你理解的数据库和数据仓库的区别。此公顿时傻眼。就技术而言,无论多难的技术,都难不倒他,唯独这种开放式问题,这是他的软肋。铩羽归来后,此公在论坛上发问。看来,我们的DBA技术素养很高,但是理论素养不足。理论的东西虽转载 2007-09-29 10:47:00 · 761 阅读 · 0 评论 -
Informatica Update 机制详解
Informatica 作为ETL工具,Update是其很重要的一个特性。也正因为如此,我们会发现在Informatica工具的很多地方都会有Update的相关设置,许多时候给大家都造成了很大的迷惑,不知道谁先谁后,谁的优先级高,或者具体的作用是什么,希望能借此文给大家一个清晰的概念。 Informatica 的Update过程简单说,就是给每条数据设置一个Delete,Inser转载 2007-10-12 09:34:00 · 3167 阅读 · 1 评论 -
开源BI项目
前段时间看了下pentahoBI开源方案,对其架构的灵活性很是佩服,其中工作流(流程)的重要性在这个项目里面被提到前所未有的高度。接触过几个商业BI项目,感觉做的东西很零散,有哪儿做哪儿,很少形成一套整体的,可扩展性的,灵活的框架。现在JAVA实现的BI开源项目很多了,但.net领域的好象还没见过,失败,有朋友了解吗?顺便问问....,基于这个原因,开个帖子抛转引点玉,大家谈谈一些各自所了转载 2007-10-15 21:44:00 · 6312 阅读 · 0 评论 -
DW项目的总结与回顾
最近一直在SONY参与一个DW项目(Sony China Tri-One Project),主要负责将用户的生产及供分析数据从SAP中ETL到搭建在ORACLE中的POOL里,并为其它系统提供相应数据接口。并且这个POOL也是由我们负责根据用户的需求来设计并构建。客观地说,我们的工作部分是整个DW项目中这个分支项目的基础与关键核心。当然,了解和熟悉DW项目的人也都会赞同我的观点。毋庸置疑,整个项目转载 2007-10-12 12:47:00 · 1441 阅读 · 0 评论 -
BI
BI是Business Intelligence的英文缩写,中文解释为商务智能,用来帮助企业更好地利用数据提高决策质量的技术集合,是从大量的数据中钻取信息与知识的过程。简单讲就是业务、数据、数据价值应用的过程。如下图所示:图(1) 从上图可以看出,传统的交易系统完成的是Business到Data的过程,而BI要做的事情是在Data的基础上,让Data产生价值,这个产生价值的转载 2007-10-15 21:18:00 · 1499 阅读 · 0 评论 -
Informatica ETL开发的命名规范
摘自Informatica联机文档, Informatica ETL开发的命名规范,实际项目中还可以考虑加上模块的名字的缩写;比较好的命名规范可以方便维护,这一点对ETL项目是十分重要的.Informatica的开发与Datastage稍有不同,比如link, DS里面对每一个link都会有一个名字,而Informatica里面link没有名字,只有在加上条件的时候,上面才显示名称。Sug转载 2007-10-15 13:04:00 · 2307 阅读 · 0 评论