Path-Level Network Transformation for Efficient Architecture Search 神经网络架构搜索

本文介绍了一种Path-Level的网络架构搜索方法,旨在通过改变神经网络的拓扑结构来寻找更优的网络设计。论文提出Net2WiderNet和Net2DeeperNet操作,以及使用LSTM和Tree-LSTM的搜索策略,有效减少了GPU计算时间,同时能生成多分支网络结构,以提高表征能力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文链接:Path-Level Network Transformation for Efficient Architecture Search

架构搜索

神经网络
根据一个已有的效果比较好的神经网络结构,找到更好的结构,例如将其中的某一层进行替换,增添一层或者减少一层,改变网络的拓扑结构。
为什么要基于已有的网络?
因为在已有的神经网络上更改拓扑结构可以利用已经训练好的权重,在巨人的肩膀上进步,为了更快的得到更好的结果。
什么是Path-Level?
链式结构如上图,我们称之为Layer-Level
Path-Level如下图:
Path-Level

Layer-Level的架构搜索

给定一个层的候选集(例如:卷积层3*3,卷积层1*1,池化层,identity),从候选集中选择一个层进行替换。
identity指的是x->x,什么都不做。
如何选择?
1. 暴力搜索:遍历每一种可能的选择通过训练后测试结果反馈来选择结果最好的网络结构。
2. 随机搜索:随机选择一种层通过训练后测试结果反馈来选择结果最好的网络结构。
3. 强化学习:在暴力搜索和随机搜索的过程中,我们可能会发现当前层选择卷积层3*3,无论网络后面怎样选择,效果都比选择卷积层1*1和池化层效果好,那么我们此时就

评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值