一、人工智能
人工智能:用人工的方法在机器(计算机)上实现的智能;或者说是人们使机器具有类似于人的智能。
人工智能学科:人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。
二、机器学习
机器学习(machine learning,ML)是一类强大的可以从经验中学习的技术。通常采用观测数据或与环境交互的形式,机器学习算法会积累更多的经验,其性能也会逐步提高。
机器学习 (ML) 是人工智能的一个子领域,涉及教导机器从数据中学习,而无需明确编程。
三、机器学习中的关键组件
数据
每个数据集由一个个样本组成,大多时候,遵循独立同分布,样本有时候也叫做数据点或者数据实例。数据来源广泛,可以是传感器收集的物理数据(如温度、湿度传感器的数据)、互联网上的文本、图像、音频等。拥有越多数据的时候,工作就越容易。更多的数据可以被用来训练出更强大的模型,从而减少对预先设想假设的依赖。
数据集的质量和规模对模型的性能有着至关重要的影响。如果数据集存在偏差或者规模过小,可能会导致模型过拟合或欠拟合
- 过拟合 :模型过于复杂,参数过多,类似于“学霸”
- 欠拟合 :模型过于简单,参数过少,类似于“学渣”
模型
任一调整参数后的程序被称为模型。
这些模型由神经⽹络错综复杂的交织在一起,包含层层数据转换,因此被称为深度学习。
深度 学习(DL):机器学习中的尖端分支
深度学习是机器学习的一个分支,基于人工神经网络,特别是深度神经网络(具有多层隐藏层的网络)。它通过模拟人脑的神经元连接方式,能够从大量的数据中自动提取高级特征和模式。
目标函数
“学习”,是指自主提高模型完成某些任务的效能。
在机器学习中,我们需要定义模型的优劣程度的度量,这个度量在大多数情况是“可优化”的,这被称之为目标函数。
定义一个目标函数,并优化它到最小值——损失函数。
预测数值任务——平方误差:预测值与实际值之差的平方。
预测分类任务——最⼩化错误率:预测与实际情况不符的样本⽐例。
损失函数是根据模型参数定义的,并取决于数据集。在一个数据集上,我们可以通过最⼩化总损失来学习模型参数的最佳值。
优化算法
当我们获得了一些数据源及其表示、一个模型和一个合适的损失函数,接下来就需要一种算法,它能够搜索出最佳参数,以最⼩化损失函数。深度学习中,大多流行的优化算法通常基于一种基本方法——梯度下降(gradient descent)在每个步骤中,梯度下降法都会检查每个参数,看看如果仅对该参数进行少量变动,训练集损失会朝哪个方向移动。然后,它在可以减少损失的方向上优化参数。