无监督学习
1 无监督学习概率
基本原理:本质是数据的压缩,如果以列为样本个数,行为样本的每个特征维度。
列的压缩为聚类。行的压缩为降维。行和列同时的操作为概率模型估计。
基本问题 :
1 聚类
硬聚类 软聚类 co-clustering 通常给定类别数
2 降维
流形 欧式空间 通常给定维度
3 概率模型估计
学习概率模型的参数结构
机器学习三要素:模型 策略 算法
无监督学习方法:
聚类:层次聚类(聚合法、分裂法)、K-Means聚类、Mean-Shift聚类、DBSCAN聚类、高斯模型+EM算法聚类、Nomolized Cut聚类… co-clustering
降维:线性降维 非线性降维
话题分析:LDA
图分析:PageRank
2 聚类方法
层次聚类(聚合法、分裂法)、K-Means聚类、Mean-Shift聚类、DBSCAN聚类、高斯模型+EM、co-clustering
链接: 详细讲解.
本文深入探讨了无监督学习的基本原理和应用,包括聚类(如层次聚类、K-Means)、降维(线性与非线性)以及概率模型估计。介绍了LDA话题分析和PageRank等技术,并列举了多种聚类方法的详细解释。
750

被折叠的 条评论
为什么被折叠?



