无监督学习就像是给计算机一堆数据,然后让它自己去发现数据里的规律。降维技术则是让复杂的数据变得更简单,方便我们理解和分析。
1. 无监督学习:让计算机自己找规律
想象一下,你有一堆照片,里面有各种各样的动物,但你没有标记这些照片是猫还是狗。你希望计算机能自己把这些照片分成不同的组,比如“猫的照片”和“狗的照片”。这就是无监督学习的任务——让计算机自己发现数据里的规律。
无监督学习的主要任务是聚类和降维。聚类是把数据分成不同的组,而降维是把复杂的数据简化成更简单的形式。今天,我们先来看看降维技术。
2. 降维技术:让复杂数据变简单
降维技术就像是把一个复杂的三维世界压缩成一个简单的二维平面。这样,我们就能更容易地理解数据,还能减少计算量。最常用的降维技术是主成分分析(PCA)。
2.1 主成分分析(PCA):找到最重要的方向
PCA的核心思想是找到数据中最“重要”的