10.28读书笔记《python元学习：通用人工智能的实现》2章孪生网络&3章原型网络&4章关系网络和匹配网络

HJ

已于 2022-10-28 21:50:30 修改

阅读量480

点赞数

文章标签：人工智能 python 学习

于 2022-10-28 20:33:56 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_42927835/article/details/127574006

版权

**

基于距离的度量学习算法：

**

第2章——孪生网络

网络原理
两个输入分别进入两个对称的神经网络（有相同的权重和架构），通过对比能量函数得到两个输入的相似程度。
架构
输入：一对
输出：Y∈｛0,1｝，正还是负
损失函数：对比损失函数
应用
验证签名、文本、图像识别、机器翻译

第3章——原型网络
1 . 基本思想：创建每个类的原型表示，根据类原型和查询点的距离对查询点进行分类。
2 . 类原型：基本是类中数据点的平均嵌入（特征）。图像可通过卷积网络，文本是通过LSTM。
3 . 过程：查询点输入到同一个嵌入函数中，得到嵌入。比较和类原型嵌入的距离，从而归类。
4 . 例子：omniglot数据集
5 . 高斯原型网络
在数据点周围添加一个以高斯协方差矩阵为特诊的置信区域。
6 .半原型网络：处理未标记样本的方法，半监督

第4章用tensorflow构建关系网络和匹配网络

关系网络
组成：嵌入函数（如CNN/RNN）+ 关系函数
one-shot过程：特征提取、特征拼接、通过关系函数(可以是普通神经网络)计算关系得分，支持数据集训练网络
few-shot：每个类的特征相加
zero-shot：虽无数据，但有元信息。将元信息编码到语义向量
用tensorflow搭建
匹配网络
一种单样本学习网络
原理：

a是注意力机制，如使用嵌入的余弦距离的softmax值。
onehot编码的标签*注意力矩阵得到概率，选概率最大。

用tensorflow搭建
（匹配网络学习正确的是正确的嵌入表示）

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。