**
基于距离的度量学习算法:
**
第2章——孪生网络
- 网络原理
两个输入分别进入两个对称的神经网络(有相同的权重和架构),通过对比能量函数得到两个输入的相似程度。 - 架构
输入:一对
输出:Y∈{0,1},正还是负
损失函数:对比损失函数
- 应用
验证签名、文本、图像识别、机器翻译
第3章——原型网络
1 . 基本思想:创建每个类的原型表示,根据类原型和查询点的距离对查询点进行分类。
2 . 类原型:基本是类中数据点的平均嵌入(特征)。图像可通过卷积网络,文本是通过LSTM。
3 . 过程:查询点输入到同一个嵌入函数中,得到嵌入。比较和类原型嵌入的距离,从而归类。
4 . 例子:omniglot数据集
5 . 高斯原型网络
在数据点周围添加一个以高斯协方差矩阵为特诊的置信区域。
6 .半原型网络:处理未标记 样本的方法,半监督
第4章用tensorflow构建关系网络和匹配网络
-
关系网络
组成:嵌入函数(如CNN/RNN)+ 关系函数
one-shot过程:特征提取、特征拼接、通过关系函数(可以是普通神经网络)计算关系得分,支持数据集训练网络
few-shot:每个类的特征相加
zero-shot:虽无数据,但有元信息。将元信息编码到语义向量
用tensorflow搭建 -
匹配网络
一种单样本学习网络
原理:
a是注意力机制,如使用嵌入的余弦距离的softmax值。
onehot编码的标签*注意力矩阵得到概率,选概率最大。
用tensorflow搭建
(匹配网络学习正确的是正确的嵌入表示)