机器学习实用知识与性能评估
在机器学习领域,有诸多实用的方面需要我们去了解,同时性能评估也是至关重要的环节。下面将为大家详细介绍相关内容。
机器学习实用知识
- 学习偏差与实际问题
- 数学论证表明“没有偏差就没有学习”,实际情况也证实了这一点。
- 有时候,底层类别的含义依赖于具体的上下文,且上下文会随时间变化,这就产生了时变类别的问题。
- 经典的机器学习技术通常假设训练集中各类别都有充分的代表,但实际中常常不满足这一要求,工程师需要处理训练集不平衡带来的困难。
- 训练集不平衡问题的解决方法
- 处理训练集不平衡问题最典型的方法是多数类欠采样和少数类过采样。
- 属性值缺失问题
- 在许多训练集中,部分属性值是未知的,这使得某些归纳技术的使用变得复杂。一种解决方案是用给定属性的最频繁值或平均值来替代未知值。
- 属性选择
- 工程师常常需要选择最合适的属性集,有两种基本方法:过滤技术和包装技术。
- 多标签领域
- 在一些领域(如文本分类)中,每个示例可以同时被标记为多个类别,这就是所谓的多标签领域。通常的解决方法是为每个类
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



