基于模糊认知图的葡萄酒数据集分类研究
1. 引言
在构建分类模型时,我们自然希望模型的性能优于随机猜测。例如,若有两个决策类别,随机猜测的准确率底线是 50%,那么分类器的准确率应高于此值。本文将以公开的“葡萄酒”数据集为例,展示基于模糊认知图(FCM)的分类器的构建过程。
2. 数据集描述
“葡萄酒”数据集记录了意大利同一地区三种不同品种葡萄酒的化学分析结果,包含 13 种成分的含量(作为特征),对应三个决策类别。各类别的实例数量分别为 59、71 和 48,数据集较为平衡,可使用准确率作为性能指标。
以下是加载数据集并进行训练集和测试集划分的代码:
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
# 加载葡萄酒数据集
# 自变量存储在 X 中
# 因变量存储在 y 中
X, y = load_wine(return_X_y=True, as_frame=True)
# 将数据划分为训练集和测试集
# 训练集占 70% 的样本
X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size=0.30, random_state=42)
数据集中的特征均为实值,具体如下:
1. 酒精(f1)
2. 苹果酸(f2)
3. 灰分(f3)
4. 灰分碱度(f4)
5. 镁(f5
超级会员免费看
订阅专栏 解锁全文
664

被折叠的 条评论
为什么被折叠?



