分子科学中的机器学习入门
在当今科技飞速发展的时代,机器学习在各个领域都展现出了巨大的潜力,分子科学也不例外。2022年7月,DeepMind宣布利用其深度学习驱动的AlphaFold系统,预测并发布了科学已知的几乎所有编目蛋白质的结构,数量超过2亿个。这一突破极大地加速了人类健康、药物开发以及几乎所有生物学领域的研究,也凸显了机器学习在分子科学广泛领域的众多研究成果。
什么是机器学习?
机器学习(ML)是从数据中学习的方法集合,它使计算机能够描述问题并做出预测,而无需明确编程。自2000年代以来,机器学习开始蓬勃发展,取得了众多成就,不仅改变了研究界,也改变了我们的日常生活。
在日常生活中,机器学习的应用随处可见:
- 识别电子邮件是否为垃圾邮件。
- 协助医生根据医学图像进行诊断。
- 在智能手机上实时翻译对话。
在分子科学领域,许多分支早就有从数据中挖掘信息并推导模型的历史,比如化学信息学,其历史至少可以追溯到半个世纪前。自2010年代初以来,分子科学的广泛领域开始广泛采用机器学习和数据驱动的方法,并将其称为“科学的第四范式”,另外三种范式分别是实验、理论和计算。分子科学中机器学习的应用实例包括:
- 预测蛋白质的三维结构。
- 优化有机合成途径。
- 识别药物候选物。
机器学习主要有三种方法:监督学习、无监督学习和强化学习。
监督学习
监督学习的目标是使用已知结果(标签)的输入数据示例,学习一个将输入数据映射到输出目标的函数。监督学习有两种类型:回归和分类。
- 回归 :旨在从输入数
超级会员免费看
订阅专栏 解锁全文
37

被折叠的 条评论
为什么被折叠?



