45、硬件感知的神经网络架构搜索

硬件感知的神经网络架构搜索

1. 引言

深度神经网络在许多应用领域展现出了巨大的潜力,但设计优秀的神经网络模型却颇具难度。这是因为具体问题及其数据集与深度神经网络(DNN)模型性能之间的关系并不明确。

在计算机视觉领域,人们常采用通用的大型现成模型,并针对自身应用进行微调。然而,当输入数据的类型和格式较为特殊(如时间序列数据)时,这种方法就不可行了,因为此时并没有通用且合适的模型。此外,通用模型往往对于当前问题而言过大,即便采用后处理方法在训练后降低模型的计算需求,也难以完全解决问题。

若要从头开始设计模型,首先需要明确处理的输入数据类型,如 2D/3D 图像、时间序列、名义数据、有序数据等,以及分类、回归、翻译等任务所需的输出类型。这会影响许多设计选项,例如卷积层适用于处理图像数据,softmax 激活函数适用于分类任务等。即便选好了 DNN 的构建模块,在 DNN 拓扑结构、训练过程(如优化器、学习率)、数据预处理(如增强、嵌入)等方面仍有大量设计选择。而且,即便尝试了许多设计选项,仍可能遗漏某个强大的超参数,从而错过大幅提升模型性能的机会。

手动设计的另一个问题是,往往只关注单一性能指标,如模型准确率,而忽略了模型运行时间和对数据集分布变化的鲁棒性等其他属性。如果模型要部署在不同的硬件平台上,情况会更加复杂,因为还需要考虑一系列新的性能问题。鉴于手动设计难以找到针对单一目标优化的模型,对于多目标设计而言,手动设计更是几乎不可能实现。因此,需要某种自动化方法来寻找不仅适用于应用性能,还能兼顾目标硬件或输入质量变化等其他方面的设计,而神经网络架构搜索(NAS)就能提供这种自动化。它是一种在庞大的神经网络设计空间中进行导航的方法。下面将介绍如何基于进化搜索从头

根据原作 https://pan.quark.cn/s/459657bcfd45 的源码改编 Classic-ML-Methods-Algo 引言 建立这个项目,是为了梳理和总结传统机器学习(Machine Learning)方法(methods)或者算法(algo),和各位同仁相互学习交流. 现在的深度学习本质上来自于传统的神经网络模型,很大程度上是传统机器学习的延续,同时也在不少时候需要结合传统方法来实现. 任何机器学习方法基本的流程结构都是通用的;使用的评价方法也基本通用;使用的一些数学知识也是通用的. 本文在梳理传统机器学习方法算法的同时也会顺便补充这些流程,数学上的知识以供参考. 机器学习 机器学习是人工智能(Artificial Intelligence)的一个分支,也是实现人工智能最重要的手段.区别于传统的基于规则(rule-based)的算法,机器学习可以从数据中获取知识,从而实现规定的任务[Ian Goodfellow and Yoshua Bengio and Aaron Courville的Deep Learning].这些知识可以分为四种: 总结(summarization) 预测(prediction) 估计(estimation) 假想验证(hypothesis testing) 机器学习主要关心的是预测[Varian在Big Data : New Tricks for Econometrics],预测的可以是连续性的输出变量,分类,聚类或者物品之间的有趣关联. 机器学习分类 根据数据配置(setting,是否有标签,可以是连续的也可以是离散的)和任务目标,我们可以将机器学习方法分为四种: 无监督(unsupervised) 训练数据没有给定...
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值