无线传感器网络中模式分类的特征选择与排序实验研究
1. 实验数据集选择
在模式分类的实验中,为了找到合适的数据集,进行了多方面的考量。一些已有的数据集,如用于人体活动识别的数据集以及 PlaceLab 数据集,虽然有一定价值,但未提及用于模式分类问题,也未定义分类基准。因此,选择了来自 UCI 机器学习库的数据集。选择这些数据集的考虑因素如下:
- 数据集应仅包含数值特征且无缺失值,这是为了让 k - NN 分类器能直接应用。
- 为进行大规模实验,选择包含大量实例和特征的数据集。
实验使用的数据集及其主要特征如下表所示:
| 数据集 | 实例数量 | 特征数量 | 类别数量 | 训练集 | 测试集 |
| ---- | ---- | ---- | ---- | ---- | ---- |
| Isolet | 7797 | 617 | 26 | 6237 | 1560 |
| Gisette | 7000 | 5000 | 2 | 6000 | 1000 |
| Semeion | 1593 | 256 | 10 | 1193 | 400 |
| Multiple Features | 2000 | 649 | 10 | 1500 | 500 |
2. 第一个实验
此实验目的是探究阈值 θ 对分类准确率和分类所需传感器测量总数(即特征)的影响。
- 准确率计算 :按照标准方式计算,公式为 accuracy = correct / total,其中 correct 是正确分类的实例数,total 是测试集中的实例总数。
超级会员免费看
订阅专栏 解锁全文
18

被折叠的 条评论
为什么被折叠?



