Meta Learning（李宏毅老师系列）

Moliay

于 2024-08-16 22:04:33 发布

阅读量1.1k

点赞数 11

分类专栏：科研路文章标签：人工智能神经网络 transformer self-attention meta learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Moliay/article/details/141266811

版权

自学参考：
视频课
 课件+资料
 笔记

一、introduction

工业界：大量GPU同时训练多组可能的超参数，找到结果较好的参数配置
学术界：“通灵”，定义一组好的参数

Meta-learning：learn to learn,希望自己学会超参数、网络架构……，帮助学术界解决问题
“学习算法”也可以看做一个函数F，它的输入是训练数据，输出是model
- 一般的ML中，F是人想出来的（hand-crafted）
- Meta Learning 自动学习“学习算法”F

在这里插入图片描述

二、Learning Algorithm

训练数据→训练任务（训练任务里的训练数据+测试数据）
测试数据→测试任务（包含训练数据+测试数据）

Step 1: What is learnable in a learning algorithm?

明确要被学的东西
让机器自己学习
⇒learnable components $\phi$

网络架构
初始参数
学习率
……

根据学习内容不同，将元学习的具体方法进行分类
在这里插入图片描述

Step 2：Define loss function for learning algorithm $F_\phi$

定义损失函数
在这里插入图片描述
很多“任务”，每个任务中有训练集和测试集

使用学到的学习算法 $F_\phi$ ，利用某个任务的训练数据进行训练，得到模型 $f_{\theta^{1*}}$
模型 $f_{\theta^{1*}}$ 性能越好时，说明学习算法 $F_\theta$ 越好，此时损失函数 $L(\theta)$ 越小
在这里插入图片描述

评估训练得到的模型 $f_{\theta^{1*}}$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。