人工神经网络与机器学习入门:从二元分类到多层感知机模型
1. 二元分类任务概述
人工神经网络(ANN)的一个流行应用是解决分类任务,这属于统计学范畴,是数据科学的一个子领域。二元分类是一种简单的分类任务,在现实生活中有很多例子。比如,考试及格的学生属于A类,不及格的属于B类;游戏、选举、人员职位分配等场景中都有赢家(A类)和输家(B类);产品、过程、物体等可以是“好”(A类)和“坏”(B类);天气可以是晴天(A类)或雨天(B类);物体(如机器人)在平面(A类)或倾斜表面(B类)上的情况等。
通常,“正类”(如A类)定义了我们在某个行动或过程中试图实现的目标,而“负类”(如B类)意味着目标或期望的“失败”。要完成二元分类任务,我们需要有输入数据,其中一部分输入数据我们已知其输出的实际值,这部分数据作为训练数据;另一部分输入数据的输出未知,作为测试数据。二元分类任务就是为任何新的输入数据集获取输出值,但由于输入数据量未知,我们只能进行预测,并追求尽可能高的准确性。
2. 二元分类的激励示例:篮球运动员选拔
以选拔篮球运动员为例,我们根据球员的年龄和身高进行选择。初始数据如下表所示:
| 球员 | 年龄(岁) | 身高(cm) | 结果 |
| — | — | — | — |
| 1 | 20 | 185 | 接受 |
| 2 | 24 | 200 | 接受 |
| 3 | 18 | 190 | 不接受 |
为了方便处理,我们将样本输入数据转换到区间[0, 1],这在统计学中称为归一化,且归一化不影响采样数据的分布。归一化后的输入数据和输出数据如下表:
| i | x1 | x2 |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



