机器学习:赋予计算机从数据中学习的能力
1. 机器学习概述
在当今时代,数据极为丰富。机器学习作为一门让算法理解数据的应用科学,是计算机科学中最令人兴奋的领域之一。借助机器学习领域的自学习算法,我们能够将海量数据转化为知识。近年来,大量强大的开源库不断涌现,现在正是进入机器学习领域、学习利用强大算法发现数据模式并预测未来事件的绝佳时机。
机器学习不仅在计算机科学研究中愈发重要,也在日常生活中发挥着越来越大的作用。例如,我们受益于强大的电子邮件垃圾邮件过滤器、便捷的文本和语音识别软件、可靠的网络搜索引擎以及具有挑战性的下棋程序。医学应用也取得了显著进展,如深度学习模型能以接近人类的准确率检测皮肤癌,DeepMind的研究人员利用深度学习预测3D蛋白质结构,首次超越了基于物理学的方法。
2. 三种不同类型的机器学习
2.1 监督学习
监督学习的主要目标是从标记的训练数据中学习一个模型,以便对未知或未来的数据进行预测。“监督”意味着训练示例(数据输入)的期望输出信号(标签)是已知的。
监督学习有两个主要子类别:
- 分类 :目标是根据过去的观察预测新实例的分类标签。这些标签是离散的、无序的值,可理解为实例的组成员身份。例如,电子邮件垃圾邮件检测是一个典型的二元分类任务,算法学习一组规则来区分垃圾邮件和非垃圾邮件。多类分类任务的一个例子是手写字符识别,算法可以将训练数据集中出现的任何类标签分配给新的未标记实例。
- 回归 :预测连续结果,也称为回归分析。在回归分析中,我们有一些预测变量(特征)和一个连续的响应变量(目标变量),试图找到它们之间
超级会员免费看
订阅专栏 解锁全文

4249

被折叠的 条评论
为什么被折叠?



