论文笔记——NEURAL ARCHITECTURE SEARCH WITH REINFORCEMENT LEARNING

本文介绍了一种使用强化学习自动设计神经网络结构的方法。通过循环神经网络(RNN)生成网络参数序列,并根据生成网络的表现反馈给RNN进行迭代优化。实验中利用800个GPU训练了12800个网络。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文地址:https://arxiv.org/abs/1611.01578

1. 论文思想

强化学习,用一个RNN学一个网络参数的序列,然后将其转换成网络,然后训练,得到一个反馈,这个反馈作用于RNN网络,用于生成新的序列。

2. 整体架构

819060-20171119202928312-385949768.png

3. RNN网络

819060-20171119202952671-272687627.png

4. 具体实现

因为每生成一个网络,都会训练一遍,Google用了800个GPU,训练了12800个网络,它采用的是分布式训练的方法。

819060-20171119203014281-1888614259.png

5. 结论

819060-20171119203052859-907901096.png

转载于:https://www.cnblogs.com/zhonghuasong/p/7861569.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值