数据挖掘与可视化:支持向量机、Apriori算法及Incanter绘图
1. 支持向量机(SVM)原理
支持向量机是一种用于线性分离数据的方法,其核心是找到最优超平面。不过,它在处理线性问题时与线性回归并无太大差异。为了提升性能,SVM会先使用核函数对数据进行转换,这能让许多非线性数据集变得线性可分,从而更易于处理。
相关资源
- LibSVM类文档: http://weka.wikispaces.com/LibSVM
- 《支持向量机傻瓜指南》: http://www.cs.ucf.edu/courses/cap6412/fall2009/papers/Berwick2003.pdf
- 电离层数据集信息: http://archive.ics.uci.edu/ml/datasets/Ionosphere
2. 使用Apriori算法挖掘数据关联
数据挖掘和聚类的主要目标之一是揭示数据中隐含的关系,Apriori算法能将这些关系提炼成明确的关联规则。以下以蘑菇数据集为例,介绍如何使用