1.分类与聚类
分类
- 从特定的数据中挖掘模式,给出判断的过程
分类学习的主要过程
- 训练数据集存在一个类标记号;
- 判断其是正向数据集,还是负向数据集;
- 对数据集进行学习训练,并构建一个训练模型;
- 通过该模型对数据集进行预测,并计算结果的性能;
聚类概述
- 目的是把数据分开;
- 事先不知到如何去分;完全由算法来判断数据之间的相似性;
- 相似的数据放到一起;
- 在聚类的结论出来之前,完全不知到每一类的特点;
- 对聚类的结果需要由人的经验来分析,各类的特点;
- 聚类的思想是“物以类聚”;
- 分类是通过标签来训练得到一个模型;
- 再对新数据进行预测; <