现阶段,针对iris数据集,我们应用了决策树、随机森林、朴素贝叶斯、神经网络和SVM这些模型来拟合数据,虽然结果略有差异,但是可以说差异不大,效果也还是很理想,主要原因因为这个数据集的特征值比较显著;接下来,我们利用几类无监督学习的方式进行原始数据集的分类,也就是常说的聚类算法。
1、kmeans聚类
kmeans聚类是最简单的一类聚类方式,聚类方法是,先随机确认中心点,然后找和他距离最近的几个点,重新分配中心点,然后反复迭代,直到每个中心点周围的点离这个中心点是最近的,并且离其他点是最远的。