大数据时代的新科学范式:数据密集型科学

本文探讨了科学范式的演变,从经验科学、理论科学、计算科学到数据密集型科学。数据密集型科学是随着信息技术发展,尤其是大数据的兴起而形成的新范式。它强调通过数据挖掘和机器学习,探索未知现象和规律,不再过度追求因果关系,而是关注相关性。这种转变对科学研究、数据科学和人工智能领域产生了深远影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >



1、什么是科学范式?


“范式”(paradigm)这一概念最初由美国著名科学哲学家Thomas Samuel Kuhn于1962年在《科学革命的结构》中提出来,指的是常规科学所赖以运作的理论基础和实践规范,是从事某一科学的科学家群体所共同遵从的世界观和行为方式。“范式”的基本理论和方法随着科学的发展发生变化。

新范式的产生,一方面是由于科学研究范式本身的发展,另一方面则是由于外部环境的推动。人类进入到21世纪以来,随着是信息技术的飞速发展,促使新的问题不断产生,使得原有的科学研究范式受到各个方面的挑战。

图灵奖得主,关系型数据库的鼻祖Jim Gray在2007年加州山景城召开的NRC-CSTB(National Research Council-Computer Science and Telecommunications Board)大会上,发表了留给世人的最后一次演讲“The Fourth Paradigm: Data-Intensive Scientific Discovery”,提出将科学研究的第四类范式。其中的“数据密集型”就是现在我们所称之为的“大数据”。Jim是一位航海运动爱好者,在会议结束后不久的2007年1月28日,他驾驶的帆船在茫茫大海中失去联系。


JimGray (right) toasts Gordon Bell at Gordon's 70th birthday, August 2004

Jim总结出科学研究的范式共有四个:

  • 几千年前,是经验科学,主要用来描述自然现象;

  • 几百年前,是理论科学,使用模型或归纳法进行科学研究;

  • 几十年前,是计算科学,主要模拟复杂的现象;

  • 今天,是数据探索,统一于理论、实验和模拟。它的主要特征是:数据依靠信息设备收集或模拟产生,依靠软件处理,用计算机进行存储,使用专用的数据管理和统计软件进行分析。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值