机器学习分类器与数据预处理全解析
1. 机器学习分类器性能评估与可视化
在机器学习中,性能评估是衡量模型好坏的关键环节。借助 scikit-learn 库的 metrics 模块,我们能够计算多种性能指标。以感知机为例,可通过以下代码计算其在测试数据集上的分类准确率:
from sklearn.metrics import accuracy_score
print('Точность: %.3f' % accuracy_score(y_test, y_pred))
这里的 y_test 代表真实的类别标签, y_pred 则是之前预测得到的类别标签。此外, scikit-learn 中的每个分类器都有 score 方法,它结合了 predict 和 accuracy_score 方法来计算分类器的预测准确率,代码如下:
print('Точность: %.3f' % ppn.score(X_test_std, y_test))
1.1 过拟合问题
过拟合是机器学习中常见的问题,它指的是模型在训练数据上表现良好,但在未知数据上的泛化能力较差。为了直观展示模型的分类效果,我们可以使用改进后的 plot_decis
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



