聚类算法与基因表达数据分析:性能评估与模型构建
在数据科学和生物信息学领域,聚类算法和基因表达数据分析是重要的研究方向。聚类算法用于将数据分组,而基因表达数据分析则有助于理解遗传信息。下面让我们深入探讨相关的实验和模型。
1. MWK - Means 初始化实验
1.1 真实数据集实验
对鸢尾花(Iris)、葡萄酒(Wine)、肝炎(Hepatitis)和皮马印第安人(Pima Indians)等数据集进行实验,分别添加不同数量的额外噪声特征。实验对比了随机初始化、Hartigan 和 Wong、Minkowski Ward、Build、Astrahan 和 iMWK - Means 这几种初始化方法。
| 数据集 | 初始化方法 | 准确率(μ) | 准确率(σ) | 最大准确率 | p | 时间(s) |
|---|---|---|---|---|---|---|
| Iris | 随机 | 93.3 | 8.3 | 96.7 | 1.2 | 0.40±0.2 |
| Iris | Hartigan 和 Wong | - | - | 96.7 </ |
超级会员免费看
订阅专栏 解锁全文
66

被折叠的 条评论
为什么被折叠?



