两种监督机器学习算法——K近邻和支持向量机的计算复杂度与准确性分析
1. 引言
在机器学习领域,使用带标签训练数据的监督机器学习算法,在解决各个应用领域的分类和回归问题时,展现出了良好的预测准确性。其中,K近邻(KNN)和支持向量机(SVM)在模式识别和医学诊断等领域广受欢迎。
KNN和SVM都可以进行二分类和多分类任务,因此被广泛应用于模式识别、图像分类、数据挖掘、目标识别和肿瘤分类等领域。不过,SVM训练模型的计算复杂度高于KNN,因为在训练实例线性不可分(非线性SVM的情况)时,需要计算最大间隔超平面(MMH)并将数据转换到更高维度。KNN是一种更为简单的模型,无需训练,被视为“懒惰学习器”。
一般来说,SVM在大多数应用领域的准确性高于KNN,但在蛋白质分析/基因功能基因组学中,基于基因表达谱进行基因分配时,KNN的表现优于SVM。接下来,我们将分析影响KNN和SVM时间复杂度和准确性的因素,并提出降低复杂度和提高准确性的可能解决方案,最后还会探讨结合两者优势的混合分类器。
2. 文献综述
多年来,关于KNN和SVM算法的研究众多,包括对算法的改进以及结合两者优点的混合算法。以下是一些相关研究成果:
- 基因表达数据用于肿瘤分类时,使用遗传算法进行特征选择,再用KNN和SVM分类器,KNN性能更好。
- 研究不同距离函数对KNN在医学数据集上准确性的影响,发现卡方距离函数效果最佳。
- 讨论球树和K-D树在高效欧几里得最小生成树问题中的性能。
- 提出使用增益比的属性加权KNN来提高准确性。
- 提出结合KNN和朴素贝叶斯的分类器,预测性能更好。
- 提出新的KNN分类
KNN与SVM算法的复杂度与准确性对比
超级会员免费看
订阅专栏 解锁全文
957

被折叠的 条评论
为什么被折叠?



