大数据

本文探讨了数据在计算机科学和软件发展中的关键作用,从冯·诺伊曼的二进制概念到埃德加·科德的关系型数据库的发明,再到大数据分析的兴起。关系型数据库的出现解决了数据组织、存储和读取的挑战,推动了软件领域的革命。随着数据量的增加,数据仓库、联机分析(OLAP)、数据挖掘成为新的焦点,尤其是数据挖掘,用于揭示隐藏的关系、模式和趋势,为决策提供新知识。数据可视化使数据更直观易懂,而结构化和非结构化数据的处理则展示了数据分析的深度和广度。数据已成为企业乃至各行业核心竞争力的一部分,未来竞争将更加依赖于数据的收集、分析和利用能力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

人类知识的三大种类与科学的关系
人类所有的知识,可以划分为三个大类·自然科学、社会科学和人文艺术。
自然科学的研究对象是物理世界,讲的是"精确丝毫不能含糊,卫星上天、潜艇下海,差之毫厘,就会谬以千里。
社会科学研究的是社会现象,探讨的是人和社会的关系,如经济学、政治学、社会学,它也追求精确,但因为关系到多变善变的人,导致了"测不准所以社会科学又被称为"准科学"。
人文艺术则主要包括文学、艺术、哲学,它探讨的是人的信仰、情感和价值,并不强调精确,有时候甚至模糊就是美,所以位于科学的最外圈。

在科学的谱系里,社会科学正好介于自然科学和人文艺术之间。

冯·诺伊曼其实是一名数学家,他之所以被称为"计算机之父其最大的贡献之一,在于他明确了计算机内部的数据组织形式:二进制。

软件是由程序和数据组成的。二进制的确定,解决了数据在计算机内部传送"理解"和"流动"的问题,但当数据在计算机内部累积得越来越多的时候,如何快速地组织、存储和读取数据又成为新的挑战。
计算机科学家一直在研究数据在软件内部的最佳组织方式。1970 年, IBM的研究员埃德加-科德(Edgar Codd) 发明了关系型数据库,成为软件发展历史上一个跨越性的里程碑。
此前,数据库的组织结构以网状、层级制为主,复杂多变,程序和数据之间你中有我、我中有你,彼此有很强的依赖性。科德提出的关系型数据库具有结构化高、冗余度低、独立性强等优点,彻底把软件中的程序和数据分立开来。
从此,软件的发展成了"两条腿"走路,程序和数据在各自的轨道上自由奔跑。

科德后来又总结出构建关系型数据库的"黄金十二定律把理论扎扎实实地推向了实践,关系型数据库开始得到大范围地推广,引发了一场软件领域
的革命。科德也因此获得1981 年的图灵奖。此后,大型软件,即大型信息管理系统的应用一日千里、遍地开花。


数据仓库和数据库的最大差别在于,前者是以数据分析、决策支持为目的来组织存储数据,而数据库的主要目的则是为运营性系统保存、查询数据。


联机分析(Online Analytical Processing) ,也称多维分析,本意是把分立的数据库"相联进行多维度地分析。"维"是联机分析的核心概念,指的是人们观察事物、计算数据的特定角度。例如,跨国零售商沃尔玛如果要分析自己的销售量,它可以按时间序列分析、商品门类分析、地区国别分析,也可以按进货渠道分析、客户群体分析,这

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值