机器学习基础:从猫狗分类到特征设计
1. 猫狗分类与机器学习通用流程
在尝试教计算机区分猫和狗的过程中,我们遇到了一些问题。使用训练好的线性模型对测试图像进行识别时,一只波士顿梗犬被误分类为猫。这是因为它尖尖的耳朵和短鼻子与训练集中的猫的特征相匹配。这个错误完全是由于我们选择的特征造成的,而这些特征是基于一个规模较小且多样性不足的训练集设计的。
为了改进模型,我们需要重新开始。具体步骤如下:
1. 收集更多数据 :形成一个更大、更多样化的训练集。
2. 设计更具区分性的特征 :例如眼睛颜色、尾巴形状等,以更好地区分猫和狗。
3. 训练新模型 :使用设计好的特征训练一个新的模型。
4. 测试新模型 :评估新模型在测试数据上的性能,看是否比旧模型有所改进。
这一过程实际上代表了典型机器学习问题的通用流程,具体如下:
|步骤|描述|
| ---- | ---- |
|0|定义问题:明确要让计算机完成的任务。|
|1|收集数据:收集训练集和测试集的数据,数据越大、越多样越好。|
|2|设计特征:确定最能描述数据的特征类型。|
|3|训练模型:使用数值优化方法在训练数据上调整合适模型的参数。|
|4|测试模型:评估训练好的模型在测试数据上的性能。如果评估结果不佳,重新考虑使用的特征,并尽可能收集更多数据。|
下面是这个流程的 mermaid 流程图:
机器学习中的特征设计与应用
超级会员免费看
订阅专栏 解锁全文

17万+

被折叠的 条评论
为什么被折叠?



