Nature:AI 如何重塑科研范式

这篇文章详细阐述了过去十年人工智能在科学领域的应用,包括自我监督学习、几何深度学习和生成式AI,强调了这些方法在数据处理、假设生成、实验设计和模型解释性方面的贡献,同时讨论了数据质量和伦理问题。

  顶刊Nature刊登了一篇来自斯坦福大学计算机科学与基因技术学院的博士后 Hanchen Wang,与佐治亚理工学院计算科学与工程专业的 Tianfan Fu,以及康奈尔大学计算机系的 Yuanqi Du 等 30 人的论文《Scientific discovery in the age of artificial intelligence》,综述了过去十年中人工智能在科学发现中的突破和挑战,以及如何利用自监督学习、几何深度学习和生成式AI方法来解决不同领域的科学问题。

图片

    人工智能 (AI) 越来越多地融入科学发现中,以增强和加速研究,帮助科学家提出假设、设计实验、收集和解释大型数据集,并获得仅使用传统科学方法可能无法获得的见解。在这里,我们回顾了过去十年的突破,包括自我监督学习(允许在大量未标记数据上训练模型)和几何深度学习(利用有关科学数据结构的知识来提高模型的准确性和效率)。生成式人工智能方法可以通过分析包括图像和序列在内的多种数据模式来创建小分子药物和蛋白质等设计。我们讨论这些方法如何在整个科学过程中帮助科学家,以及尽管取得了这些进步仍然存在的核心问题。人工智能工具的开发人员和用户都需要更好地了解何时需要改进这些方法,而数据质量和管理不佳带来的挑战仍然存在。这些问题跨越科学学科,需要开发有助于科学理解或自主获取科学理解的基础算法方法,使它们成为人工智能创新的关键领域。

图片

一、AI辅助的数据收集和整理

    这篇文献介绍了AI方法如何提高数据的选择、标注、生成和精炼的效率和质量,以及如何从大规模的无标签数据中学习有意义的数据表示,例如利用几何先验、自监督学习和语言建模等技术。

    主要包括以下几个方面:

  • 数据选择:AI可以帮助科学家从海量的数据中筛选出有价值的信息,例如在粒子物理实验中,使用深度自编码器来检测罕见的事件,或者在地球科学、海洋学和天文学中,使用无监督的异常检测方法来发现新的现象。

  • 数据标注:AI可以利用伪标签、标签传播、主动学习等技术来自动或半自动地给大量的无标签数据添加标签,从而减少人工标注的成本和时间。例如,在生物学中,可以使用基于图的方法来给新发现的分子或蛋白质赋予功能和结构的标签。

  • 数据生成:AI可以利用数据增强和深度生成模型等技术来创建更多的合成数据,从而提高模型的鲁棒性和泛化能力。例如,在医学影像、材料科学、化学和生物学等领域,可以使用生成对抗网络来合成逼真的图像或序列。

    • 数据精炼:AI可以利用深度卷积方法等技术来提高数据的质量和精度,例如去噪、超分辨率、结构恢复等。例如,在单细胞基因组学、高能物理、生物显微镜等领域,可以使用自编码器或变分自编码器等方法来提取数据的本质特征并消除噪声的影响。

      图片

           

            该图展示了如何利用人工智能方法学习科学数据的有意义的表示,包括几何深度学习、自监督学习和语言建模。每个子图都给出了一个具体的例子,说明了这些方法在不同的科学领域中的作用。例如,几何深度学习可以处理分子和材料等具有几何和关系结构的数据,自监督学习可以通过对比学习等策略来提取图像或序列数据的相似性和差异性,语言建模可以通过遮盖语言模型等技术来捕捉自然语言和生物序列的语义。该图的目的是展示人工智能如何通过不同的方式来理解和操作科学数据,从而为科学研究提供有价值的指导和预测。

二、AI驱动的科学假设生成

    这篇文献讨论了AI方法如何生成可测试的科学假设,包括使用黑盒预测器、组合优化、可微分假设空间等策略,以及如何使用强化学习、贝叶斯优化等技术指导假设的搜索和评估。

    人工智能驱动的科学假设生成是指利用人工智能技术,如机器学习、自然语言处理、知识图谱等,来帮助科学家从海量的数据和文献中发现潜在的规律、关联和创新点,从而提出新的科学假设。这些假设可以指导科学家进行实验设计、数据分析和理论建模,加速科学发现的过程。

图片

    以上图中:展示了人工智能(AI)在科学假设生成方面的三种方法。图中的每个子图都对应一个不同的领域和任务,如物理、化学和数学。图中的每个子图都包含以下元素:

  • a:高通量筛选。这个子图展示了如何使用AI预测器来从一个庞大的候选池中选择具有期望性质的对象,如化合物、材料或生物分子。这个过程可以利用自监督学习来预训练预测器,然后在有标签的数据集上微调预测器。实验室评估和不确定性量化可以优化这个过程,使其更加高效和准确。

  • b:AI导航器。这个子图展示了如何使用强化学习来在符号回归中导航假设空间。以牛顿万有引力定律为例,这个子图展示了如何使用奖励函数和设计准则,如奥卡姆剃刀,来聚焦于最有前途的表达式树。通过不断地执行这个过程,AI导航器可以收敛于与数据一致并满足其他设计准则的数学表达式。

  • c:AI差分

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

明哲AI

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值