无监督学习Unsupervised learning

本文探讨无监督学习的特性,对比有监督学习,强调其在数据压缩、降维及生成模型上的应用。深入讨论无监督学习如何模仿人类学习方式,通过聚类、主成分分析、图结构发现和数据补全等技术,实现对未标记数据的有效处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

无监督学习的特点是训练数据没有标签,无监督学习识别和利用数据中的模式进行诸如数据压缩或降维(如自编码器)或生成模型(如GAN等)之类的任务。

数据的压缩和降维涉及到使用比原始数据表示更少的信息进行编码。

生成模型可以对训练及数据的分布进行逼近,然后从该近似分布中生成新的数据点。

 

无监督学习与有监督学习存在两点不同:

1. 有监督学习属于条件密度估计,而无监督学习为无条件密度估计。

2. 无监督学习一般需要创建多变量概率模型。而有监督学习的预测值通常是一个单变量,因此大多数有监督学习问题我们可以采用单变量概率模型,其大大简化了问题。

但是对于多输出的有监督分类问题仍需要多变量的概率模型。

无监督学习更像人类或动物的学习方式。相比于有监督学习,无监督学习有着更广泛的适用性,因为其不需要人类专家进行标签制作。

标签不仅昂贵,而且相比于原始数据信息量大大减小,其不足以可靠地估计复杂模型的参数。

获得丰富信息最好的方式是信息输入本身。

 无监督学习的应用

聚类

数据降维,主成分分析

发现图结构

数据 / 矩阵补全(图像修复,协同过滤,Market basket analysis

 

转载于:https://www.cnblogs.com/jiangkejie/p/10397908.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值