机器学习中的聚类、分类与优化方法
1. 聚类算法与模型
1.1 深度聚类方法
在处理大规模图像数据时,深度聚类方法展现出了显著的优势。其中,mini - batch k - means和随机梯度下降(SGD)在深度聚类中扮演着重要角色。mini - batch k - means通过更新样本和聚类中心,极大地减少了计算和内存开销,同时避免了连续迭代中特征不一致导致的漂移误差。而SGD则用于更新CCNN模型的参数,以提高模型的性能。
1.2 基于变分自编码器(VAE)的深度聚类
VAE作为AE的一种变体,对AE的潜在代码施加了明确的分布约束。通过重参数化的神经网络,VAE拟合条件后验,以增强变分推理目标。VaDE是基于VAE的一种方法,其公式为:
[VaDE = E[\log p(x|z)] - D_{KL}(q(z, c|x) || p(z, c))]
其中,第一项表示重建损失,第二项表示从高斯混合先验 (p(z, c)) 到变分后续值 (q(z, c|x)) 的Kullback - Leibler(KL)偏差,可视为聚类损失 (L_c)。
1.3 基于生成对抗网络(GAN)的深度聚类
GAN是一种强大的深度生成模型,通过在一对神经网络之间进行对抗性修改,将样本 (z) 从先验分布 (p(z)) 映射到数据空间。深度对抗聚类(DAC)是基于对抗AE的深度聚类模型,其目标函数包含了AE重建目标、对抗目标和高斯混合概率。分类生成对抗网络(CatGAN)则是GAN的一种扩展,用于将数据实例分类到先验选择的类别中。
超级会员免费看
订阅专栏 解锁全文
10万+

被折叠的 条评论
为什么被折叠?



