机器学习在不同领域的应用与挑战
1. k - NN分类器的误差调整机制
在机器学习分类任务中,往往存在假阳性和假阴性两种类型的错误。为了让用户能够根据实际需求调整分类器的行为,改变这两种错误出现的频率,k - NN分类器提供了一种有效的解决方案。
以7 - NN分类器为例,若要减少假阳性的数量,可指示分类器仅将至少有5个最近邻为正类的示例标记为正类,不满足此条件的示例则标记为负类;若要降低假阴性的频率,可让分类器在至少有3个最近邻为正类时就返回正类标签。用户对某种错误类型的偏好,通过确定示例被标记为正类所需的投票数来体现。
1.1 相关思考问题
- 工程师如何处理许多属性冗余或无关的问题?他们是如何识别这些不太有用的属性的?
- 训练集中类标签的可靠性如何?这对分类器的预期性能意味着什么?
- 讨论在该领域中,假阳性和假阴性这两种错误的各自成本。能否用相同的单位来比较它们?为什么用户需要一种机制来以增加另一种错误的代价来减少一种错误?
- 解释使k - NN分类器能够增加或减少两种错误之一的机制的本质。
2. 睡眠阶段分类
2.1 睡眠阶段识别的重要性
在医学实践中,准确识别特定的睡眠阶段至关重要。例如,婴儿猝死综合征(SIDS)几乎总是发生在快速眼动(REM)睡眠阶段。对于疑似处于危险中的新生儿,医院只需在REM阶段加强监测,就能及时进行复苏。此外,睡眠阶段的分布情况可用于诊断特定的神经疾病,如癫痫,而睡眠图(hypnogram)就是一种有用的诊断工具。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



