行星科学中的机器学习入门
1. 机器学习方法概述
机器学习(ML)有一个广泛使用的定义,来自卡内基梅隆大学教授汤姆·米切尔:“如果一个计算机程序在某些任务类T上的性能,以性能度量P衡量,随着经验E的增加而提高,那么就说该程序从经验E中学习”,更简单地说,“机器学习是对通过经验自动改进的计算机算法的研究”。
机器学习涉及使用计算机程序基于经验(以数据或观察的形式)学习某些任务,任务学习的好坏由某种性能指标衡量。例如,电子邮件垃圾邮件过滤器就是一个机器学习系统:计算机程序通过观察数百万已知是垃圾邮件或非垃圾邮件的示例邮件,学习将邮件分类为垃圾邮件或非垃圾邮件,其学习效果通过正确分类邮件的百分比(准确率)来衡量。
机器学习是人工智能(AI)更广泛领域中的一个子集方法。计算机视觉也是AI的一个子领域,描述了对图像、视频或其他视觉内容进行感知(包括识别和理解)的方法。计算机视觉和机器学习有很大的重叠,因为机器学习方法(如卷积神经网络)经常用于计算机视觉任务(如检测火星卫星图像中的陨石坑),不过计算机视觉也可能借鉴非机器学习方法(如尺度不变特征变换SIFT)。
机器学习方法通常分为以下子类型:
1. 监督学习 :提供的数据包括“特征向量”和“标签”。特征向量是用于表示特定数据样本可观察特征的值(或一组值),标签则表示该样本的正确输出。例如,一个样本可能由图像形式的特征向量(表示为像素值向量)和表示图像类别的整数标签组成。监督学习又分为分类和回归,分类中机器学习模型将输入特征映射到离散输出类,回归中模型将输入特征映射到连续输出值(即实数)。
2. 无监督学习 :输入数据类似,但没
超级会员免费看
订阅专栏 解锁全文
29

被折叠的 条评论
为什么被折叠?



