3、机器学习中的无监督、半监督与强化学习算法

机器学习中的无监督、半监督与强化学习算法

1. 无监督学习算法概述

在无监督学习场景中,没有“隐藏的老师”,所以其主要目标并非最小化相对于真实标签的预测误差。这里的“真实标签”概念与有监督学习有所不同。在有监督学习使用分类器时,我们希望训练样本的误差为零,即除了真实类别外,其他类别都不会被判定为正确。而在无监督学习中,模型要在没有明确指示的情况下学习样本中的信息,能学习的元素仅来自样本本身。无监督算法通常旨在发现样本间的相似性和模式,或者根据一组向量重现输入分布。常见的无监督模型类别有以下几种:

1.1 聚类分析

聚类分析(通常简称为聚类)是要找出大量样本间的共同特征。它基于一个隐含假设,即样本可根据相似性分组。给定两个向量,相似性函数定义为距离函数的倒数。例如在欧几里得空间中:
- 相似性函数:为避免除以零,引入常数 ε。显然,距离越小,相似性越大。
- 聚类规则:一个聚类包含与代表样本距离最小(即相似性最大)的所有元素。样本被分配到聚类后,可与同一聚类的其他成员共享特征。

聚类分析的一个重要应用是提高相似样本的同质性。比如推荐引擎可基于用户向量(包含兴趣和购买产品信息)进行聚类。若用户 A 购买并好评了产品 P,可将其推荐给未购买的用户 B。

1.2 生成模型

生成模型也是一种无监督学习方法。其概念与有监督算法类似,但数据生成过程中没有标签。目标是建模一个参数化分布,并优化参数,使候选分布与数据生成过程的距离最小化,通常基于 Kullback - Leibler 散度或其他类似度量。训练结束后,假设损失趋近于零,即候选分布近似于数据分布。使用生成模型可生成与训练样本不同但属于同一分布的新样本。例如生成对抗

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值