《Weight Agnostic Neural Networks》（权重无关网络）论文简介

最新推荐文章于 2023-04-27 15:44:06 发布

dreamweaverccc

最新推荐文章于 2023-04-27 15:44:06 发布

阅读量366

点赞数

CC 4.0 BY-SA版权

文章标签：权重无关网络

本文链接：https://blog.youkuaiyun.com/dreamweaverccc/article/details/100023792

本文探讨了一种不同于传统调参的神经网络研究方法，通过固定权重并专注于网络架构设计，以实现特定功能的最佳表现。灵感源自生物本能，论文提出了一套算法流程，用于创建和优化最小网络，直至达到性能极限。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

https://weightagnostic.github.io/
https://github.com/google/brain-tokyo-workshop/tree/master/WANNRelease

现在大部分关于神经网络性能的研究关注于网络参数的优化上，即如何调参。这篇论文给我们提供了一个不一样的思路：设计网络的最优架构。

论文的想法启发于生物学：很多生物在刚出生时（没有经过大量的练习），便具有某些特定的能力，如逃避捕食者等。因此，对于某些特定的功能，设定特定的神经网络架构即可解决。

论文通过给整个网络部署一个相同的权重，来消除权重对网络性能的影响。然后再改变权重的值，观察该网络架构在不同权重下所能取得的最好结果。

完整的论文算法步骤如下图所示: 1) 创建多个最小网络；2）在最小网络上分配不同的权重；3）根据网络性能和复杂度对最小网络进行排序；4）在取得最好结果的最小网络进行迭代（包括插入节点、增加链接和改变激活函数等）。重复步骤2）到4）直到迭代没有性能的提升时停止。

在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

dreamweaverccc

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Attention Is All You Need 论文解析之八——performer 一种新型的注意力机制——performer(关注器)，它采用局部感知捕捉局部特征和全局线形函数组合的方式

AI天才研究院

09-01

1925

作者：禅与计算机程序设计艺术 1.简介最近几年深度学习在图像、文本、声音等领域取得了重大突破，大幅提升了模型性能，已经成为自然语言处理、图像识别、图像分类、目标检测等领域的基础技术。但同时也带来了新的复杂性——如何高效计算并利用注意力机制对复杂数据进行建模？如何在模型尺寸不受限制的前提下，降低参数量，

Relational inductive biases, deep learning, and graph networks（关系归纳偏差、深度学习和图形网络）

weixin_41697507的博客

07-15

5186

Relational inductive biases, deep learning, and graph networks Peter W. Battaglia1, Jessica B. Hamrick1, Victor Bapst1, Alvaro Sanchez-Gonzalez1, Vinicius Zambaldi1, Mateusz Malinowski1, Andrea Tacche...

参与评论您还未登录，请先登录后发表或查看评论

[论文笔记] Weight Agnostic Neural Networks

Holeung blog

08-04

983

Experiment

谷歌论文Weight Agnostic Neural Networks（WANN）权重无关神经网络

祥瑞的技术博客

12-06

1736

论文地址： https://arxiv.org/abs/1906.04358 项目及代码地址： https://weightagnostic.github.io/ 目录一、概览 1.1 贡献点 1.2 背景二、方法 2.1 本文做法 2.2 相关工作 2.3 方法网络结构搜寻结构搜索 Topology search 2.4 性能与复杂度评估三、实验及结果 ...

论文翻译 —— Weight Agnostic Neural Networks 权重无关神经网络

佚失的诗篇

01-31

1380

这篇《Weight Agnostic Neural Networks》是前一段比较火的一篇论文了，号称找到了 “不用进行训练的神经网络”，称作WANNs，下面给出我对此文的翻译。能力有限肯定有不准确或词不达意的地方，大家以原文为准可以在这里（交互式）查看此论文的交互式版本注意，以下用黑色框框柱的部分以及这种红字部分是我做的补充解释，非原文内容。注意，以下图片说明文字全部用斜体，放在图片上方...

论文Weight Agnostic Neural Networks(WANNs)解读

蓝一潇的博客

06-22

2543

告别深度学习炼丹术！谷歌大脑提出“权重无关”神经网络

THU数据派

06-17

634

来源：新智元本文约5600字，建议阅读10+分钟。无需权重训练！谷歌再向深度学习炼丹术发起“攻击”。[ 导读 ]神经网络训练中“权重”有多重要不言而喻。但现在，可以把权重...

AlexNet论文翻译（中英文对照版）-ImageNet Classification with Deep Convolutional Neural Networks

bigcindy的博客

04-15

5334

ImageNet Classification with Deep Convolutional Neural Networks 深度卷积神经网络的ImageNet分类 Alex Krizhevsky University of Toronto 多伦多大学 kriz@cs.utoronto.ca Ilya Sutskever Univ...

【论文阅读】2_A Survey on Model Compression and Acceleration for Pretrained Language Models

zoetu

04-27

614

模型压缩与加速综述2，关于method和future部分。

【告别调参！】google开源“权重无关”神经网络（Weight Agnostic Neural Networks,WANN）

Zack的博客

08-28

1055

前言谷歌大脑备受关注的“权重无关神经网络”（《Weight Agnostic Neural Networks》）终于开源了！《Weight Agnostic Neural Networks》是谷歌大脑 David Ha 等人所著。其关键思想是通过不再强调权重来搜索网络结构，仅使用随机共享的权重，也可以执行各种任务的神经网络。 github地址 github地址： https://git...

不更新权重只更新结构的神经网络《Weight Agnostic Neural Networks》读后总结

yzqlyzql的博客

10-15

702

不更新权重只更新结构的神经网络《Weight Agnostic Neural Networks》读后总结前言前言这是一些对于论文《Weight Agnostic Neural Networks》的简单的读后总结，首先先奉上该文章的下载超链接：点击这里下载论文。这篇文章有交互式版本：交互式版本，这个交互式版本里面有非常多的视频，可以直观的看到这篇文章要做什么，做了什么以及做得怎样。 ...

神经网络的气宗与剑宗之争：先验强大的网络甚至不需要训练

AI 研习社的博客

06-14

1024

雷锋网 AI 科技评论按：深度神经网络中有许多连接权重，这些权重的值对网络表现有巨大影响；通过反向传播可以定向优化这些权重，提高网络的表现，这个过程被称作「训练」；训练过程通常需要多轮迭代，需要大量的稠密矩阵运算；这些都是领域内的常识。因为训练过程如此地重要，深度学习研究人员们都会设立多 GPU 阵列加速训练过程，关于训练技巧的论文连篇累牍，甚至还有「深度学习调参师」、「玄学调参」、「希望上帝给我...

基于等式约束的车辆纵向动力学模型预测控制及其Matlab数值仿真实验研究指南

07-31

内容概要：本文探讨了车辆纵向动力学模型预测控制，特别是引入等式约束条件下的实现方法，并通过Matlab数值仿真实验验证了其有效性和优越性。文章首先介绍了车辆纵向动力学模型的基本概念，包括牵引力、空气阻力、轮胎与地面的摩擦力等因素对车辆速度的影响。接着详细阐述了预测控制算法的工作原理，即通过优化算法寻找最佳的牵引力和制动力，以实现最佳行驶效果。最后展示了Matlab数值仿真实验的具体步骤和结果，对比了不同控制策略的性能，证明了基于模型的预测控制策略在复杂道路和交通环境下具有更高的准确性和鲁棒性。适合人群：从事汽车工程、自动化控制领域的研究人员和技术人员，尤其是关注车辆动力学建模和预测控制算法的人士。使用场景及目标：适用于希望深入了解车辆纵向动力学模型预测控制理论并掌握其实现方法的研究人员和技术人员。目标是提高车辆的安全性、节能性和驾驶辅助系统的智能化水平。阅读建议：读者可以重点关注等式约束条件下的预测控制算法设计思路，以及Matlab数值仿真实验的设计和结果分析部分，以便更好地理解和应用这一先进技术。

基于React框架构建的现代化前端Web应用程序开发模板_包含完整开发环境配置和构建工具链_用于快速启动React项目开发_支持热重载和自动化测试_集成Webpack和Babel构.zip

最新发布

07-31

【业余无线电】FT8jtdx-2.2.158 石家庄业余无线电俱乐部定制版-win32

07-31

【业余无线电】【FT8】jtdx-2.2.158 石家庄业余无线电俱乐部定制版-win32

langchain4j-community-redis-spring-boot-starter-1.0.1-beta6.jar中文文档.zip

07-31

1、压缩文件中包含：中文文档、jar包下载地址、Maven依赖、Gradle依赖、源代码下载地址。 2、使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 3、特殊说明：（1）本文档为人性化翻译，精心制作，请放心使用；（2）只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等；（3）不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 4、温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件。 5、本文件关键字： jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册。

MATLAB复现凝固相场模拟及多元合金各向异性枝晶生长的实践——激光增材制造、选区激光熔融等场景下凝固模型的集成应用

07-31

MATLAB在实现凝固相场模拟中的应用，涵盖了纯物质及合金凝固模型、各向异性枝晶生长、激光增材制造、选择性激光熔融（SLM）等多场景。相场模拟作为一种定量分析材料行为的方法，通过数值计算模拟材料的相场分布，研究材料的凝固过程、微观组织结构等。文章还展示了MATLAB复现ACTA文章核心模拟的部分，包括选材与工艺、相场模拟实现、结果分析及其应用与展望。适合人群：材料科学家、增材制造工程师、冶金工程师、研究人员和技术爱好者。使用场景及目标：适用于需要理解和优化合金凝固过程的研究人员和技术人员，特别是在3D打印、增材制造、焊接熔池、定向凝固等领域。目标是帮助读者掌握MATLAB在相场模拟中的具体应用，提高对合金凝固行为的理解和预测能力。其他说明：文章不仅提供了理论背景，还包括了具体的MATLAB代码实现步骤和实际案例分析，使读者能够在实践中更好地应用这些知识。

基于Matlab的棕熊优化算法IBOA改进研究：动态自适应参数、t分布变异与黄金正弦策略

07-31

内容概要：本文深入探讨了棕熊优化算法（BOA）的改进版本IBOA，主要集中在三个关键改进点：动态自适应参数、自适应t分布变异以及黄金正弦位置更新策略。首先介绍了动态自适应参数的调整方法，使得参数C随迭代次数平滑变化，从而更好地平衡全局探索和局部开发。其次，引入了自适应t分布变异策略，通过动态调整自由度参数df，实现了早期全局搜索和后期局部挖掘的有效结合。最后，提出了黄金正弦位置更新策略，利用黄金分割比例和正弦函数来增强种群多样性和加快收敛速度。此外，还对IBOA进行了性能评估，将其与PSO、GWO等经典算法进行了对比，展示了IBOA在复杂多峰函数优化中的优越性。适合人群：从事优化算法研究的科研人员、工程师以及对群体智能算法感兴趣的学者。使用场景及目标：适用于解决复杂的非线性优化问题，特别是那些具有多个极值点的问题。目标是在提高算法收敛速度的同时，确保找到全局最优解。其他说明：文中提供了详细的MATLAB代码实现，并给出了具体的参数设置建议，如初始种群规模、并行计算优化和早停机制等。同时，所有代码均已开源，方便读者复现和进一步研究。

基于基恩士KV-7500系列PLC与普洛菲斯触摸屏的高效LCD背光检测系统 LCD检测

07-31

基于基恩士KV-7500系列PLC和普洛菲斯触摸屏构建的高效LCD背光检测系统的硬件架构、功能模块及其核心功能。该系统采用多轴运动控制、智能配方管理和多种检测手段，确保LCD背光的亮度、色彩、均匀性和功耗均达到高标准。具体功能包括亮度和色彩测量、均匀性检测、功耗评估及故障诊断等。此外，还涵盖了自动上、下料和多摄像头三重检测等高效生产流程。适合人群：从事工业自动化、电子制造领域的工程师和技术人员，尤其是对LCD背光检测感兴趣的从业者。使用场景及目标：适用于需要高精度检测LCD背光性能的质量控制和质量保证流程，旨在提升LCD产品的质量和生产效率。其他说明：文中提供了部分PLC梯形图和Python代码片段，展示了具体的实现细节，帮助读者更好地理解和应用相关技术。

WANN算法matlab

05-19