你经常会听到人工智能(AI)、机器学习(ML)、神经网络(NNs)和深度学习(DL)这些术语。
今天,我们将讨论人工智能、机器学习、神经网络和深度学习之间的相互关系。
通过查看上面的图表(见本文的封面图片),我们可以得出以下结论。
- 人工智能是一个广泛的领域。机器学习、神经网络和深度学习是人工智能的子领域。
- 神经网络和深度学习是机器学习的特定领域。在学习神经网络和深度学习之前,你应该熟悉一般的机器学习知识。
- 并非所有的神经网络都是深度学习模型。
让我详细解释一下每个术语。
人工智能(AI)
人工智能是一种先进的技术,它使机器和系统能够获得智能和预测能力。人工智能系统从我们提供的过往经验或数据中学习。机器学习(ML)和深度学习(DL)是人工智能的两个最重要的方面。如今,我们可以看到复杂的人工智能系统。然而,它们中的大多数与存在自然智能的人类大脑还相差甚远。
机器学习(ML)
机器学习是指计算机能够从数据中学习而无需进行明确编程的能力。区分机器学习和传统编程可能会很有帮助。
在传统编程中,程序员会明确编写规则,以定义程序在计算机或机器上的运行方式。但在机器学习中,模型是从数据中学习规则的。我们无需明确编写这些规则。不过,我们仍然需要编写构建机器学习模型所需的代码。
在训练机器学习模型时,它应该从数据中学习,而不是记住数据。在从数据中学习的过程中,机器学习模型能够发现数据中隐藏的模式,或者对训练过程中未使用的新数据做出准确的预测。如果一个机器学习模型只是记住数据而不是学习数据中的模式,那么它将无法对新的输入数据进行泛化。在这种情况下,模型往往会出现过拟合——这是我们在训练过程中应该避免的一个问题。
机器学习可以分为三个不同的类别。
监督学习
在监督学习中,机器学习模型是用有标签的数据进行训练的。我们需要为输入提供数据样本(称为X)和标签(称为y)。监督学习算法的目标是找到一个函数f(θ),它能更准确地将X映射到y。在训练过程中从数据中学习到的模型参数会以使得目标函数最小化的方式进行更新。一个监督模型会预测一个结果,并将其与真实(实际)值进行比较。监督学习模型有两种类型——回归和分类。回归模型预测一个连续值,而分类模型预测一个离散值(类别)。线性回归、逻辑回归、支持向量机、决策树、随机森林、XGBoost、CatBoost是一些常用的监督学习算法。
无监督学习
在无监督学习中,机器学习模型是用无标签的数据进行训练的。我们只为输入提供数据样本(称为X)。无监督学习的目标是发现数据中隐藏的模式、结构和关系。聚类和降维是无监督学习的两种主要类型。聚类是在数据中找到组群,而降维是减少数据中的维度(变量数量)。
强化学习
在强化学习中,算法与环境进行交互,以学习解决问题的策略。这里只有一个奖励系统,没有像监督学习那样的误差计算过程。目标是开发一个能够从与环境的交互中学习的系统。这种类型的学习通常用于游戏(例如国际象棋)、机器人技术和导航系统中。
神经网络(NNs)和深度学习(DL)
我们经常互换使用这些术语,因为神经网络和深度学习之间只有很小的区别。神经网络(通常称为人工神经网络——ANNs)的灵感来自人类大脑。这样的一个神经网络是通过将多个人工神经元(感知器)堆叠在一起形成的。
神经网络的深度是由其隐藏层的数量来定义的。没有隐藏层或只有一个隐藏层的人工神经网络被称为浅层神经网络。有两个或更多隐藏层的人工神经网络被称为深度神经网络。训练(学习)深度神经网络的过程被称为深度学习。深度学习中的“深度”一词指的是网络中隐藏层的数量(深度)。
深度学习是神经网络(NNs)的一个子领域。这是因为我们不把训练浅层神经网络的过程视为深度学习。
我们经常训练有两个以上隐藏层的神经网络。没有隐藏层或只有一个隐藏层的人工神经网络不够强大,无法学习数据中的复杂关系。它们与一般的机器学习模型非常接近。例如,我们可以把逻辑回归看作是一个没有隐藏层的非常简单的神经网络模型。
有一些深度神经网络的共同特点。由于这些特点,深度学习与机器学习有所不同。
- 深度神经网络需要大量的数据才能实现高性能。如果数据量较少,它们甚至无法超越一般的机器学习算法。
- 它们能够学习数据中的复杂关系。
- 它们需要大量的计算资源来进行训练。
- 准确率很高。
- 它们是黑箱模型。深度学习算法不容易被解释。
- 深度神经网络需要更多的时间来训练。
- 深度神经网络可以从大型数据集中自动提取特征。这是深度学习相对于机器学习的一大优势。
总结
人工智能被认为是一种新型的“电力”,它将我们的生活转变为一种完全不同的模式。由于有了人工智能,我们有了自动驾驶汽车、人工智能医疗保健系统、语音识别系统、图像处理系统、推荐系统等等。所有这些都定义了我们的生活方式和商业模式。
机器学习和深度学习是人工智能的两个最重要的方面。由于智能设备的存在,每秒都会产生大量的数据。与此同时,随着技术的进步,计算资源的成本也在降低。这些因素共同为开发机器学习和深度学习系统提供了关键的途径。
机器学习和深度学习系统可以将数据转化为信息,将信息转化为知识。在人类的监督下,信息和知识可以转化为可操作的见解,并应用于解决现实世界中的商业问题。