机器学习全流程:从调试到生产的关键要点
1. 主动学习技术
在机器学习中,主动学习是一种重要的技术,用于选择需要人工标注的实例。以下是几种常见的主动学习技术:
| 技术名称 | 描述 |
| — | — |
| 不确定性采样 | 选择在推理过程中具有最大不确定性的实例,在分类问题中,这些实例通常是最接近决策边界的实例。 |
| 预期模型变化 | 选择那些已知标签后会对当前模型产生最大影响的实例。 |
| 密度加权不确定性采样 | 选择不仅具有最高不确定性,而且能代表特征空间中许多其他数据点的实例,这依赖于数据在特征空间中的密度。 |
| 误差减少估计 | 选择那些已知标签后能最大程度减少未来误差的实例。 |
| 委员会查询 | 训练多个模型(委员会),选择这些模型预测结果分歧最大的实例。 |
| 方差减少 | 选择那些已知标签后能最大程度减少模型参数不确定性的实例。 |
在实际项目中,可以使用 Python 库如 modAL 来实现这些主动学习技术,将人工反馈融入机器学习生命周期。
2. 代码调试与错误处理
2.1 代码示例与错误类型
以下是一个简单的 Python 函数示例,用于统计列表中奇数的数量:
def odd_counter(num_list: list):
"""
:param num_list: list of integers to be checked for
identifying odd numbers
:return
超级会员免费看
订阅专栏 解锁全文
1805

被折叠的 条评论
为什么被折叠?



