24、机器学习实用知识与性能评估

机器学习实用知识与性能评估

在机器学习领域,有诸多实用的方面需要我们去了解,同时性能评估也是至关重要的环节。下面将为大家详细介绍相关内容。

机器学习实用知识
  1. 学习偏差与实际问题
    • 数学论证表明“没有偏差就没有学习”,实际情况也证实了这一点。
    • 有时候,底层类别的含义依赖于具体的上下文,且上下文会随时间变化,这就产生了时变类别的问题。
    • 经典的机器学习技术通常假设训练集中各类别都有充分的代表,但实际中常常不满足这一要求,工程师需要处理训练集不平衡带来的困难。
  2. 训练集不平衡问题的解决方法
    • 处理训练集不平衡问题最典型的方法是多数类欠采样和少数类过采样。
  3. 属性值缺失问题
    • 在许多训练集中,部分属性值是未知的,这使得某些归纳技术的使用变得复杂。一种解决方案是用给定属性的最频繁值或平均值来替代未知值。
  4. 属性选择
    • 工程师常常需要选择最合适的属性集,有两种基本方法:过滤技术和包装技术。
  5. 多标签领域
    • 在一些领域(如文本分类)中,每个示例可以同时被标记为多个类别,这就是所谓的多标签领域。通常的解决方法是为每个类
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值