利用 Keras 开启机器学习之旅
1. 机器学习简介
机器学习是一门利用机器模拟人类任务,并使机器在执行任务过程中不断提升性能的科学。通过向机器输入现实世界事件的观测数据,机器能够发现数据中的模式和关系,从而优化目标函数,例如提高二元分类任务的准确率或降低回归任务的误差。
以猫狗图片分类任务为例,人类完成该任务轻而易举,准确率通常很高,但分类每张图片大约需要一秒钟,且扩大任务规模只能通过增加人力来实现,这可能并不可行。虽然机器要达到人类的准确率有一定难度,但机器每秒可以处理大量图片,并且可以通过提升单台机器的处理能力或优化算法来轻松扩展任务规模。
同样的机器学习原理也可应用于人类难以完成的分类任务,比如在磁共振成像(MRI)中识别肿瘤。人类完成这项任务需要经验丰富的医学专业人员,而机器可能只需要一组标注好的图像数据集。
2. 数据表示
我们构建模型是为了了解训练数据以及数据特征之间的关系,这些知识能帮助我们处理新的观测数据。然而,现实世界中的观测数据与训练机器学习模型所需的数据格式有很大差异。以文本数据为例,人类阅读文本时能理解每个单词,并结合上下文理解其含义,但机器无法直接解读这种上下文信息,除非对其进行特殊编码,否则机器不知道如何将文本转换为可输入的数值。因此,我们需要对数据进行适当的表示,通常是将非数值数据类型(如文本、日期和分类变量)转换为数值类型。
3. 数据的表格形式
许多机器学习问题所使用的数据是二维的,可以用行和列来表示。而图像数据则可能是三维甚至四维的,每张图像有二维的形状(高度和宽度),多张图像构成第三维,颜色通道(红、绿、蓝)则构成第四维。
下面是一
超级会员免费看
订阅专栏 解锁全文
1004

被折叠的 条评论
为什么被折叠?



