机器学习在不同数据集的应用及印度儿童营养状况分析
机器学习数据集应用
在机器学习领域,不同的数据集能帮助我们解决各种实际问题,下面将介绍几个典型数据集及相关模型应用。
- 钞票数据集
- 数据特征 :钞票数据集包含四个用于描述钞票样本的特征,分别是方差、偏度、峰度和熵。这些特征是通过工业相机进行印刷检查,并利用小波变换工具从图像中提取得到的。
- 变量相关性 :从热力图可以看出,大多数变量与数据集的相关性较弱。
- 目标变量与自变量 :目标变量为“Class”,用 Y 表示,其他自变量用 X 表示。
- 模型训练 :在进行预测时,KNN 的邻居数量设置为 5 并进行了训练。以下是部分相关模型的表现:
|模型|准确率|ROC 分数|精确率|
| ---- | ---- | ---- | ---- |
|KNN| - | - | - |
|随机森林分类器| - | - | - |
graph LR
A[导入钞票数据集] --> B[数据特征提取]
B --> C[变量相关性分析]
C --> D[特征选择]
D --> E[模型训练(KNN)]
- 中风数据集
- 数据特征
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



