人类所有的知识,可以划分为三个大类·自然科学、社会科学和人文艺术。
自然科学的研究对象是物理世界,讲的是"精确丝毫不能含糊,卫星上天、潜艇下海,差之毫厘,就会谬以千里。
社会科学研究的是社会现象,探讨的是人和社会的关系,如经济学、政治学、社会学,它也追求精确,但因为关系到多变善变的人,导致了"测不准所以社会科学又被称为"准科学"。
人文艺术则主要包括文学、艺术、哲学,它探讨的是人的信仰、情感和价值,并不强调精确,有时候甚至模糊就是美,所以位于科学的最外圈。
在科学的谱系里,社会科学正好介于自然科学和人文艺术之间。
冯·诺伊曼其实是一名数学家,他之所以被称为"计算机之父其最大的贡献之一,在于他明确了计算机内部的数据组织形式:二进制。
软件是由程序和数据组成的。二进制的确定,解决了数据在计算机内部传送"理解"和"流动"的问题,但当数据在计算机内部累积得越来越多的时候,如何快速地组织、存储和读取数据又成为新的挑战。
计算机科学家一直在研究数据在软件内部的最佳组织方式。1970 年, IBM的研究员埃德加-科德(Edgar Codd) 发明了关系型数据库,成为软件发展历史上一个跨越性的里程碑。
此前,数据库的组织结构以网状、层级制为主,复杂多变,程序和数据之间你中有我、我中有你,彼此有很强的依赖性。科德提出的关系型数据库具有结构化高、冗余度低、独立性强等优点,彻底把软件中的程序和数据分立开来。
从此,软件的发展成了"两条腿"走路,程序和数据在各自的轨道上自由奔跑。
科德后来又总结出构建关系型数据库的"黄金十二定律把理论扎扎实实地推向了实践,关系型数据库开始得到大范围地推广,引发了一场软件领域
的革命。科德也因此获得1981 年的图灵奖。此后,大型软件,即大型信息管理系统的应用一日千里、遍地开花。
数据仓库和数据库的最大差别在于,前者是以数据分析、决策支持为目的来组织存储数据,而数据库的主要目的则是为运营性系统保存、查询数据。
联机分析(Online Analytical Processing) ,也称多维分析,本意是把分立的数据库"相联进行多维度地分析。"维"是联机分析的核心概念,指的是人们观察事物、计算数据的特定角度。例如,跨国零售商沃尔玛如果要分析自己的销售量,它可以按时间序列分析、商品门类分析、地区国别分析,也可以按进货渠道分析、客户群体分析,这