机器学习在数据分类任务中发挥着重要作用,而 MATLAB 提供的 Classification Learner App(分类学习器) 让机器学习建模变得更加直观和高效。本文将从零开始介绍如何使用分类学习器进行数据分类,涵盖数据准备、模型训练、评估及导出模型的完整流程。
目录
1. 什么是分类学习器?
Classification Learner 是 MATLAB 提供的一个交互式 App,用于:
-
训练分类模型(如 SVM、决策树、随机森林、神经网络等)。
-
自动比较不同算法 的性能。
-
可视化分类结果(如混淆矩阵、ROC 曲线)。
-
导出模型 用于后续预测或部署。
适用场景:
-
监督学习(需要带标签的数据)。
-
二分类(如垃圾邮件检测)或多分类(如手写数字识别)。
2. 启动分类学习器
方法 1:通过 MATLAB 命令窗口
classificationLearner
方法 2:通过 MATLAB 工具栏
-
点击 APP 选项卡。
-
在 Machine Learning and Deep Learning 部分选择 Classification Learner。
3. 数据准备
分类学习器要求输入数据为 表格(Table) 或 矩阵(Matrix),其中:
-
每一行 代表一个样本。
-
每一列 代表一个特征。
-
最后一列(或单独指定)是 类别标签(必须为分类变量
categorical
)。
示例:加载鸢尾花数据集
load fisheriris; % 加载内置数据集
data = table(meas, species); % 转换为表格
确保标签列是 categorical
:
data.species = categorical(data.species);
4. 使用分类学习器
步骤 1:导入数据
-
在分类学习器中,点击 New Session。
-
选择数据源(如
data
表格)。 -
指定 特征变量(
meas
)和 响应变量(species
)。
步骤 2:选择模型
-
快速训练:点击 All 训练所有可用模型(如决策树、SVM、集成方法等)。
-
手动选择:在 Models 部分选择特定算法(如
SVM
、Random Forest
)。
步骤 3:训练与评估
-
点击 Train 训练所选模型。
-
查看 Accuracy(准确率)和 Confusion Matrix(混淆矩阵)。
-
使用 ROC 曲线 评估二分类模型的性能。
步骤 4:优化模型
-
特征选择:剔除无关特征(如使用 PCA 降维)。
-
超参数调优:调整
Kernel Scale
(SVM)、Number of Trees
(随机森林)等参数。
5. 导出模型
训练完成后,可将模型导出到工作区或生成 MATLAB 代码:
-
导出模型:
-
点击 Export Model 保存为
trainedModel
。 -
使用
predict
进行新数据预测: -
predictions = trainedModel.predictFcn(newData);
-
-
生成代码:
-
点击 Generate Function 生成训练脚本,便于复现或修改。
-
6. 总结
步骤 | 操作 |
---|---|
数据准备 | 表格格式,标签为 categorical |
模型选择 | SVM、决策树、随机森林等 |
训练与评估 | 准确率、混淆矩阵、ROC 曲线 |
模型导出 | 生成代码或直接用于预测 |
分类学习器是 MATLAB 中一个强大的交互式工具,特别适合机器学习初学者或需要快速比较模型的场景。通过本文的指导,你可以轻松完成从数据导入到模型部署的全流程!
希望这篇博客能帮助你掌握 MATLAB 分类学习器的使用!如果有任何问题,欢迎在评论区讨论。🎯