模型训练技巧——激活函数mish

最新推荐文章于 2025-11-15 18:01:23 发布

原创最新推荐文章于 2025-11-15 18:01:23 发布 · 1.2k 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#神经网络

模型训练技巧专栏收录该内容

8 篇文章

订阅专栏

本文深入解析了Mish激活函数的数学表达式及其特性，并提供了详细的PyTorch实现代码。Mish函数定义为：Mish = x * tanh(ln(1 + e^x))，其独特的非线性和自适应性质使其在神经网络中表现出色。

部署运行你感兴趣的模型镜像

代码地址：https://github.com/lessw2020/mish

1. mish的公式表达和曲线

　公式表达：Mish=x * tanh(ln(1+e^x))

　曲线表达，如下图所示：

2. mish的pytorch实现

class Mish(torch.nn.Module):
    def __init__(self):
        super().__init__()

    def forward(self, x):
        x = x * (torch.tanh(torch.nn.functional.softplus(x)))
        return x

　　效果还不错，你也试试吧！

您可能感兴趣的与本文相关的镜像

PyTorch 2.8

PyTorch

Cuda

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

guopeiAI

关注关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

【DL经典回顾】激活函数大汇总（六）（Mish & Softsign附代码和详细公式）

悦学共鸣，温柔以待，汇聚光芒，共同成长

03-14

1109

本博客主要介绍Mish和Softsign两种激活函数。

1. 深度学习——激活函数

qq_32468785的博客

11-10

1459

激活函数是一种用于神经网络和其他机器学习模型中的非线性函数。它被应用于神经网络的每个神经元上，将输入信号进行转换，产生输出信号。激活函数的作用是引入非线性性质，使神经网络能够学习和表示更复杂的函数关系。在神经网络中，每个神经元接收来自上一层神经元的加权输入，然后通过激活函数对这个加权输入进行非线性变换，生成神经元的输出。这个输出被传递到下一层神经元作为输入。激活函数的主要作用有以下几点：引入非线性：激活函数能够将线性变换后的输入转换为非线性输出，使得神经网络具备非线性建模能力。

参与评论您还未登录，请先登录后发表或查看评论

mish激活函数

bblingbbling的博客

06-22

3714

mish激活函数函数公式函数图像作用代码实现函数公式 y = x*tanh(ln(1+exp(x))) 函数图像作用 激活函数每一点更加平滑，允许更好的信息深入神经网络，负值的时候允许较小的负梯度流入，保证信息不会中断，从而得到更好的准确性和泛化。代码实现 class Mish(Layer): def __init__(self, **kwargs): super(Mish, self).__init__(**kwargs) self.supports_ma

Mish、β-Mish激活函数

weixin_38190702的博客

07-12

1427

Mish系列的激活函数

Mish激活函数项目教程

热门推荐

码农ZZK的博客

11-13

1万+

前言人们对激活函数都在不断探究，而现在广泛应用的激活函数通常是relu，tanh这两种但是relu在负值的时候直接截断梯度下降的不够平滑因而有团队提出一种新的激活函数来进行优化 Mish激活函数 Mish激活函数的表达式为 Mish = x*tanh(ln(1+e^x)) 使用matplotlib画图可得从图中可以看出他在负值的时候并不是完全截断而是允许比较小的负梯度流...

神经网络的激活函数（六）GELU和Mish

深数研究院

11-25

1851

GELU通过高斯误差函数（即标准正态分布的累积分布函数）对输入进行平滑处理，从而提高模型的性能。GELU在许多任务中表现出色，特别是在自然语言处理（NLP）和计算机视觉任务中。

YOLOv5改进系列（13）——更换激活函数之SiLU，ReLU，ELU，Hardswish，Mish，Softplus，AconC系列等

路人贾的博客

07-04

6871

手把手教你学会YOLOv5改进系列之如何更换激活函数，内含SiLU，ReLU，ELU，Hardswish，Mish，Softplus，AconC系列等详细讲解及改进方法！

YOLOv9改进策略【损失函数篇】| 替换激活函数为Mish、MetaAconC、FReLU、PReLU、Swish

Limiiiing的博客

06-23

1958

在卷积神经网络中，激活函数通过在神经网络中引入非线性，使网络能够学习和逼近复杂函数，从而处理复杂的模式识别与分类问题。今天先记录一下Mish激活函数的使用方法，后续会陆续补充其它经典激活函数和新发布的激活函数的调用方法。

神经网络中各种激活函数的Python实现

11-22

本资源主要是可视化各种激活函数：Relu，sigmoid ，swish，mish等，只需要依赖numpy，不需要安装pytorch，只是一个简单的demo

python 深度学习中的4种激活函数

12-16

这篇文章用来整理一下入门深度学习过程中接触到的四种激活函数，下面会从公式、代码以及图像三个方面介绍这几种激活函数，首先来明确一下是哪四种： Sigmoid函数 Tahn函数 ReLu函数 SoftMax函数 激活函数的作用下面图像A是一个线性可分问题，也就是说对于两类点(蓝点和绿点)，你通过一条直线就可以实现完全分类。当然图像A是最理想、也是最简单的一种二分类问题，但是现实中往往存在一些非常复杂的线性不可分问题，比如图像B，你是找不到任何一条直线可以将图像B中蓝点和绿点完全分开的，你必须圈出一个封闭曲线。而激活函数就是帮助”绘制”这个封闭曲线的非线性函数，有了激活函数

mish-cuda:PyTorch 的 Mish 激活函数

05-30

Mish-Cuda：自正则化非单调激活函数 这是 Diganta Misra ( ) Mish 激活的 PyTorch CUDA 实现。安装它目前作为仅源代码的 PyTorch 扩展分发。因此，您需要正确设置工具链和 CUDA 编译器才能安装。工具链- 在cxx_linux-64包提供了适当的工具链。但是，这取决于系统，仍然可能存在兼容性问题。您也可以尝试使用系统工具。 CUDA 工具包- 除了驱动程序之外，还需要来提供所需的头文件和工具。从 nVidia 获取适合您的 Linux 发行版的版本，或者检查发行版的特定说明。重要的是您的 CUDA 工具包与 PyTorch 构建的版本相匹配，否则可能会发生错误。目前 PyTorch 为 v10.0 和 v9.2 构建。表现 CUDA 实现似乎反映了原始实现的学习性能，并且没有观察到稳定性问题。在函数的速度方面，它

CNN常用激活函数Mish、ReLU与Softplus详解及可视化实现

ReLU 的最大优势在于计算简单高效，避免了传统Sigmoid或Tanh函数中存在的梯度消失问题（尤其是在深层网络中），同时具备稀疏激活性——即部分神经元不被激活，有助于提升模型泛化能力和训练速度。然而，ReLU 也存在...

python绘制mish激活函数图像

weixin_42037342的博客

06-06

3926

####直接上代码 import numpy as np import math import matplotlib.pyplot as plt e=math.e def tanh(x): return (e**x-e**(-x))/(e**x+e**(-x)) def softplus(x): return math.log(1+pow(e,x)) def mish(x): return x*tanh(softplus(x)) x=np.linspace(-5,5,1000...

【激活函数】Mish激活函数详解

Roaddd的博客

03-14

1万+

● Mish公式： ● Mish图像： ● 导数： ● Mish优点： ● 和其他激活函数的比较：