【学习】auto-encoder、feature disentanglement、discrete representation、anomaly detection


一、auto-encoder

1、auto-encoder

auto-encoder也是使用无标注的资料进行训练。
在这里插入图片描述
auto-encoder的概念:
跟cycle GAN的思想很像。encoder的输出vector叫embedding、representation或者code。我们输入高维的图片到encoder里面得到一个低维向量(dimension reduction高维转低维,这个low dim叫做bottleneck瓶颈),然后把这个低维向量用在下游任务。
在这里插入图片描述

在这里插入图片描述
为什么能够压缩复原图片呢?事实上对于图片来说,不是所有的像素分布都是能组成图片的,只有一些分布是表示图片的。所以我们可以可以用一些低纬度的矩阵表示高纬度的矩阵。
在这里插入图片描述
auto-encoder不是一个新的思想。这是以前的一些做法:
在这里插入图片描述

2、de-nosing auto-encoder

在原图上加上噪声之后输入到encoder里面,decoder还原的目标是还原原图,也就是要去掉噪声还原图片。,
BERT可以看成是一个de-noising auto-encoder:在这里插入图片描述

二、feature disentanglement

Representation includes information of different aspects表示包括不同方面的信息
一段文字/图片/声音信号放到auto-encoder的时候,embedding是混合很多种信号的。feature disentanglement要做的就是分辨出auto-encoder的embedding不同维度的不同信息。
在这里插入图片描述

在这里插入图片描述

1、应用:voice conversion声音转换

过去:要让两种声音说一样的话,这样不切实际。
现在:两种声音可以不说一样的话,不用同意的语音,就能实现这个转换。

在这里插入图片描述
而在feature disentanglement能够分辨内容和说话者信息,那样就能把内容和声音混合了。

在这里插入图片描述

三、discrete representation

embedding可以是真实数据表示的向量,也可以是二元向量、或者是one-hot向量。
在这里插入图片描述

1、VAVAE

把embedding(query)与一个codebook的向量(key)算相似度,最像的一个被选出来输入到decoder里面,然后三个一起训练:encoder、decoder、codebook。
在这里插入图片描述

embedding也可以是text。

把文章输入,得到类似的输出,中间的embedding可能是摘要。但是这是不真实的,因为摘要可能是人看不懂的,但是机器可以看懂的。
这些输入可以是大量的无标注文章。

在这里插入图片描述
所以我们要让他看人写的摘要,加入discriminator,用RL训练,就变成了cycle GAN了。
在这里插入图片描述
实现的比较好的:
在这里插入图片描述
表现的不太好:
在这里插入图片描述
总结:确实能把一段文字作为embedding。
还有可能是树结构:
在这里插入图片描述

四、更多应用

decoder跟generator很像,可以把D当初G用。
在这里插入图片描述

compression压缩

可以把embedding看出是压缩的结果。不过这个输出是会失真的(lossy)。
在这里插入图片描述

anomaly detection

给定一组训练数据{x1,x2,…,xN},检测输入x是否类似于训练数据。
在这里插入图片描述
没有说某些东西一定是异常的。
在这里插入图片描述

异常检测的应用

信用卡诈骗检测、网络入侵检测、癌细胞检测。这样可以做分类任务吗?实际上异常检测是资料是难以收集的,比如异常资料难收集,我们通常只有一个类别的资料。作为分类器是不适合的,但是可以用auto-encoder训练。
在这里插入图片描述

auto-encoder

训练的时候希望输入输出越接近越好,但是测试的时候如果发现输入和输出之间的差距很大,那可能就是异常的资料,不能被重建出来,就能用来进行异常检测。
在这里插入图片描述

五、anomaly detection异常检测

给定一组训练数据{x1,x2,…,xN},我们希望找到一个函数来检测输入x是否与训练数据相似。
在这里插入图片描述在这里插入图片描述
不能当做二元分类的问题:1、异常数据很多,无法被视为一个类别;2、很难找异常类别。

1、分类

(1)输入训练资料x,资料有标签y^,我们希望训练一个分类器识别这些数据并且能够输出“unknown”。
(2)没有标签,资料是干净的(所有资料都是正常的)或者资料是被污染的(混有一点异常资料)。

训练分类器

每个输入x都有一个标注表示这个x是什么。
在这里插入图片描述
输入x,不仅写出是什么,还输出一个置信度c。置信度门限λ,大于λ的是正常资料,小于的是异常资料。
在这里插入图片描述
如果是正常输入,那置信度很高;如果是异常图片,就会输出比较平均的分布。自信度是输出最高的分数。
在这里插入图片描述

置信度

训练直接输出置信度的网络(不仅可以输出分布还能输出置信度)。
在这里插入图片描述

示例框架

训练集:辛普森一家中人物的x幅图像。每个图像x由它的字符标记y^。训练一个分类器,我们可以从分类器中获得置信度得分c(x)。根据置信度与门限的比较判断这个输入是正常的还是异常的。

dev集:图像x标记每张图片x是否来自辛普森一家。数据有来自辛普森或者不是辛普森。我们可以计算f(x)的performance,使用dev集确定λ和其他超参数。
在这里插入图片描述

在这里插入图片描述
因为正常样本和异常样本分布悬殊,所以准确性不是一个好的衡量标准!一个系统可以有很高的准确率,但是什么都不做。
在这里插入图片描述
那用什么判断呢?
错误:正常资料被判定为异常资料(错误警报);异常资料被判断为正常资料(missing)。
在这里插入图片描述
在这里插入图片描述
这两个移动λ的系统哪个更好?取决于我们认为missing和错误警报哪个更重要。
在这里插入图片描述
一些评估指标考虑排名。

可能问题

区分猫和狗的类别,不是这个类别的放在线上,其他老虎?
在这里插入图片描述
变黄之后,准确度高!
在这里插入图片描述
学习分类器:对异常给出低置信度分数
如何获得异常?通过生成模型生成?
在这里插入图片描述

无标签资料

在这里插入图片描述
给定一组训练数据{x1,x2,…,xN,我们希望找到一个函数来检测输入x是否与训练数据相似。
在这里插入图片描述
在没有分类器的时候可以使用P(x)
在这里插入图片描述
在这里插入图片描述
我们还是需要一个数值化的表示:

极大似然

假设数据点是从概率密度函数fθ (x)中采样的,θ决定了fθ (x)的形状,θ未知,可从数据中找到。
在这里插入图片描述
输入:向量x,
输出:决定函数形状的抽样概率密度x
θ决定均值u和协方差矩阵E
高斯分布里面,取样大多出于u附近。
在这里插入图片描述
二维比较简单,增加:
在这里插入图片描述
可以用auto-encoder做
在这里插入图片描述
在这里插入图片描述

引用: Auto-encoder是一种深度学习模型,用于将输入数据编码为低维表示,并尽可能地重构原始数据作为输出。在降维方面,PCA会将不同类别的数据混合在一起,而auto-encoder则可以将它们分开。除了降维之外,auto-encoder还有其他用途,比如图片搜索。 引用: 训练一个auto-encoder的过程通常会先固定一些权重参数,然后逐层训练多个自编码器,每个自编码器的输入和输出维度逐渐逼近目标维度。最后,可以使用反向传播来微调网络参数。现在也可以不进行预训练,直接训练auto-encoder。此外,auto-encoder还可以与卷积神经网络(CNN)一起使用。 引用: 特征区分技术是指在auto-encoder中,通过编码器获取的Embedding向量中,可以区分出不同输入数据的特征信息。比如,对于语音输入,可以分别提取出语音内容和说话者的特征。这就是Feature Disentangle的目标。 根据李宏毅老师的讲解,auto-encoder是一种用于降维、重构和特征提取的深度学习模型。它可以将输入数据编码为低维表示,并尽可能地重构原始数据作为输出。除了降维之外,auto-encoder还可以用于图片搜索等任务。训练auto-encoder时,可以使用预训练和微调的方法,也可以直接进行训练。此外,auto-encoder还可以与卷积神经网络(CNN)结合使用。特征区分技术可以用于auto-encoder中,用于提取不同输入数据的特征信息。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值