2.4无监督学习Part-1
①例1:聚类算法Clustering:它将未标记的数据放入不同的集群中(图右)
ps:【聚类算法应用:谷歌新闻】— 寻找文章,找到提到相似词的文章并将他们分组到集群中,现在这些聚类算法会自行计算出哪些词暗示某些文章属于同一组
②例2:聚类算法:
·聚类遗传或DNA数据:颜色显示了不同个体具有或不具有特定基因活性的程度,运行聚类算法,可以把个体分组到不同的类别中。
·这是无监督学习是因为我们没有提前告诉算法,有一种人具有某些特征,让算法自动找出主要类型的个体,因为我们无法为算法提供正确答案。
③例3:客户分组:为了给客户提供更好的服务
④总结:
聚类算法是一种无监督算法,获取没有标签的数据并且尝试自动将他们分组到集群中
2.5无监督学习Part-2
①监督学习中:
数据同时带有输入x和输入标签y。无监督学习中:数据仅带有输入x而没有输出标签y。
②无监督学习可以分为以下三类:
聚类算法clustering | 异常检测anomaly detection | 降维dimensionality reduction |
将相似的数据点组合在一起 | 检测异常事件 | 将一个大数据集压缩成小数据集,同时丢失尽可能少的东西 |