数据驱动的科学与工程:机器学习、动态系统与控制
一、数据驱动科学与工程的变革
在当今时代,数据驱动的发现正彻底改变我们对复杂系统进行建模、预测和控制的方式。现代科学和工程领域面临的诸多紧迫问题,难以依靠经验模型或基于第一性原理的推导来解决。因此,研究人员越来越多地转向数据驱动的方法,以应对如湍流、大脑活动、气候、流行病学、金融、机器人技术和自主系统等复杂系统。
这些复杂系统通常具有非线性、动态性、时空多尺度和高维度的特点,不过其数据中往往存在主导性的低维模式。借助现代数学方法,以及前所未有的数据和计算资源,我们能够解决以往难以攻克的问题。例如,通过稀疏且有噪声的随机像素测量实现稳健的图像重建、利用机器学习进行湍流控制、优化传感器和执行器的放置、仅从数据中发现可解释的非线性动态系统,以及使用降阶模型加速具有复杂多尺度物理特性系统的优化和控制。
现代数据科学的发展得益于低成本传感器的显著创新、计算能力的大幅提升以及几乎无限的数据存储和传输能力。大量的数据为各学科的工程师和科学家提供了数据驱动发现的新机遇,这被称为科学发现的第四范式。它是经验实验、分析推导和计算研究这前三个范式的自然延伸,这些技术的整合为数据驱动的发现工作提供了变革性的框架。
数据科学并非新生事物,早在50多年前就由John Tukey提出。自那时起,数据科学主要由两种不同的文化视角主导:机器学习社区(主要由计算机科学家组成)通常关注预测质量和可扩展的快速算法;统计学习社区(常位于统计系)则侧重于推断可解释的模型。这两种方法都取得了显著成功,为数据科学方法奠定了数学和计算基础。对于工程师和科学家而言,目标是利用这些广泛的技术从观测中推断和计算模型(通常是非线性的),以正确识别潜在的动态,并在定性和定
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



