半监督特征选择与网络剪枝算法研究
1. 数据描述与实验设置
在实验中,使用了一个玩具数据集和七个UCI数据集,具体情况如下:
- 高斯数据 :高斯数据集中的两类合成样本分别从两个高斯分布$N((0, 0)^T, I)$和$N((3, 0)^T, I)$中抽取,其中$I \in R^{2×2}$是单位矩阵。总共有600个样本,每个类别300个。对于每个类别,80%的数据作为训练样本,其余作为测试样本。
- UCI数据 :七个UCI数据集涵盖了广泛的领域(包括病理学、车辆工程、生物信息、金融等),规模从267到1473,特征数量从9到34。所有数据集在训练和测试前都进行了归一化处理,使特征值在区间$[-1, 1]$内。每个UCI数据集随机分为两个子集,70%用于训练,30%用于测试。
| 数据集 | 样本数量 | 属性数量 | 类别数量 |
|---|---|---|---|
| Australian | 700 | 14 | 2 |
| CMC | 1473 | 9 | 2 |
| German | 1000 | 24 |
超级会员免费看
订阅专栏 解锁全文
2228

被折叠的 条评论
为什么被折叠?



