机器学习入门:从区分猫狗开始
在当今科技飞速发展的时代,机器学习作为一个新兴且极具潜力的领域,正逐渐改变着我们的生活。它能够让计算机执行各种各样的任务,如图像中物体的自动检测、语音识别、医学知识发现以及预测分析等。接下来,我们将通过一个简单的例子——教计算机区分猫和狗的图片,来深入了解机器学习的基本原理和流程。
教计算机区分猫和狗
在日常生活中,父母教孩子区分猫和狗时,通常不会给出正式的科学定义,而是让孩子通过大量的图像来直观地认识这两种动物。同样,计算机也可以通过类似的方式学习区分猫和狗的图片,这在机器学习中被称为分类问题。下面我们详细介绍解决这个问题的步骤:
-
收集数据
计算机需要通过一批示例数据(即训练集)来学习区分猫和狗。直观地说,训练集越大、越多样化,计算机(或人类)执行学习任务的效果就越好,因为更多的示例能让学习者积累更多的经验。例如,我们可以准备一个包含不同猫和狗的图片的训练集。 -
设计特征
思考一下我们自己是如何区分猫和狗的图片的。我们可能会关注颜色、大小、耳朵或鼻子的形状等特征。计算机也需要类似的特征来进行区分。设计优质的特征通常不是一件容易的事,因为这很大程度上取决于具体的应用场景。例如,“腿的数量”这个特征在区分猫和狗时就没有帮助,因为它们都有四条腿,但在区分猫和蛇时却很有用。
对于这个简单的例子,我们假设可以从训练集中的每张图片中轻松提取以下两个特征:
- 鼻子相对于头部的大小(从小到大为范围);
- 耳朵的形状(从圆形到尖形为范围)。 <
超级会员免费看
订阅专栏 解锁全文
54

被折叠的 条评论
为什么被折叠?



