关于NASAS的论文笔记

最新推荐文章于 2024-08-25 20:40:01 发布

帅气的风

最新推荐文章于 2024-08-25 20:40:01 发布

阅读量691

点赞数

分类专栏：深度学习文章标签： NAS

本文链接：https://blog.youkuaiyun.com/bensss20112011/article/details/100109530

版权

这篇博客探讨了一种基于后验分布的One-Shot NAS方法，它解决了传统NAS的优化问题，提高了效率并减少了Fine-tune的需求。通过变分推理和重参数化技巧，该方法能在大型数据集上寻找高性能网络结构，并通过在验证集上的表现选择最佳结构。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

此篇博客来自这篇论文One-Shot Neural Architecture Search Through A Posteriori Distribution Guided Sampling

一.介绍NAS

NAS全称是Neural Architecture Search, 就是神经网络架构搜索。这一思想主要是从迁移学习的方向引伸出来。我主要介绍它的优化问题，在NAS中，解决就是两个问题，一个是权重优化，一个是网络结构的优化。
最原始的NAS优化问题如下
$w_a^{*} = argmin_{w_a}L_t(M(a, w_a))$
$a^* = argmin_{a\in G}L_v(M(a, w_a^{*}))$
其中G代表的是一些网络预先定义网络结构，比如3x3卷积核等，t代表训练集，v代表验证集， $M(a,w_a)$ 代表网络结构和权重的网络。
结构如下：（图片居中不了抱歉）
NASAS
由于这种结构优化起来很慢，计算复杂度高，因而有了很多改进，近几年就出现one-shot model 可以有效提高优化速度，但存在权重和网络结构的无匹配问题。现在讲讲关于基于后验分布的one-shot model可以有效提高效率并且不需要Fine-tune，利用权重共享就能达到较高性能和准确率，由于以往的NAS很少能适应大型数据集，而这种方法能较好适应。

二. 关于基于后验分布的NAS的思想

NAS的问题是如何从训练集中得到网络并且具有泛化性能，泛化性能我们是通过验证集来进行做的。基于后验分布的NAS思想就是这样，我们就是要从一个训练集中去得到网络结构和权重参数，那我们可以用贝叶斯的方法求解。
$p(\varphi|X, Y) = \frac{p(Y|X, \varphi)p(\varphi)}{\int_{\varphi}p(Y|X, \varphi)}$
这里的 $\varphi=\{\varphi_{l,k}^s\}($ 这里的