论文链接:Path-Level Network Transformation for Efficient Architecture Search
架构搜索
根据一个已有的效果比较好的神经网络结构,找到更好的结构,例如将其中的某一层进行替换,增添一层或者减少一层,改变网络的拓扑结构。
为什么要基于已有的网络?
因为在已有的神经网络上更改拓扑结构可以利用已经训练好的权重,在巨人的肩膀上进步,为了更快的得到更好的结果。
什么是Path-Level?
链式结构如上图,我们称之为Layer-Level
Path-Level如下图:
Layer-Level的架构搜索
给定一个层的候选集(例如:卷积层3*3,卷积层1*1,池化层,identity),从候选集中选择一个层进行替换。
identity指的是x->x,什么都不做。
如何选择?
1. 暴力搜索:遍历每一种可能的选择通过训练后测试结果反馈来选择结果最好的网络结构。
2. 随机搜索:随机选择一种层通过训练后测试结果反馈来选择结果最好的网络结构。
3. 强化学习:在暴力搜索和随机搜索的过程中,我们可能会发现当前层选择卷积层3*3,无论网络后面怎样选择,效果都比选择卷积层1*1和池化层效果好,那么我们此时就