深度学习基础

最新推荐文章于 2024-07-11 15:29:24 发布

A_Coding_man

最新推荐文章于 2024-07-11 15:29:24 发布

阅读量179

点赞数

分类专栏：深度学习

本文链接：https://blog.youkuaiyun.com/m0_46744629/article/details/118669787

版权

深度学习专栏收录该内容

5 篇文章

订阅专栏

这篇博客介绍了深度学习的基础概念，包括逻辑回归的数学公式，sigmoid激活函数及其导数计算，以及常用的损失函数——交叉熵损失。还详细讲解了梯度下降法在优化参数过程中的作用。最后，通过偏导数计算展示了逻辑回归模型中权重和偏置的更新规则。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

深度学习

深度学习基础

深度学习基础

1. 逻辑回归(简单)：

$z = d o t (w, x) + b$

2. sigmoid激活函数

$\partial(z)=\frac {1}{1+e^{-z}}$
在这里插入图片描述
sigmoid求导： $\frac {1}{1+e^{-x}}$

$\space \space \space \space \space \space \space y^{'}_{x} = [(1+e^{-x})^{-1}]^{'}$

$\space \space \space \space \space \space \space \space \space \space \space \space = [- (1+e^{-x})^{-2} e^{-x} (-1)]$

$\space \space \space \space \space \space \space \space \space \space \space \space =\frac{e^{-x}}{(1+e^{-x})^{2}}$

$\space \space \space \space \space \space \space \space \space \space \space \space =\frac{e^{-x}}{1+e^{-x}} \frac{1}{1+e^{-x}}$

$\space \space \space \space \space \space \space \space \space \space \space \space =\frac{1+e^{-x}-1}{1+e^{-x}} \frac{1}{1+e^{-x}}$

$\space \space \space \space \space \space \space \space \space \space \space \space =(1-\frac{1}{1+e^{-x}}) \frac{1}{1+e^{-x}}$

$\space \space \space \space \space \space 因：y = \frac {1}{1+e^{-x}}$

$\space \space \space \space \space \space \space \space \space \space \space \space = (1-y)y$

3. 损失函数(常用)

$L(\hat y^{(i)}, y^{(i)}) = -[y^{(i)} ln(\hat y^{(i)}) + (1-y^{(i)})ln(1-\hat y^{(i)})]$

成本函数：
$\frac{1}{m}\sum_{i=1}^{m}L(\hat y^{(i)}, y^{(i)}) = -\frac{1}{m}\sum_{i=1}^{m}[y^{(i)} ln(\hat y^{(i)}) + (1-y^{(i)})ln(1-\hat y^{(i)})]$

4. 梯度下降

$w^{'} = w - r d w$

5. 逻辑回归的偏导数

逻辑回归：

$z = w_1x_1+w_2x_1 + b$
$\hat y =a=\partial(z) = \frac{1}{1+e^{-(w_1x + w_2x + b})}$
$L(\hat y^{(i)}, y^{(i)}) = -[y^{(i)} ln(\hat y^{(i)}) + (1-y^{(i)})ln(1-\hat y^{(i)})]$

求偏导

1. 求 $dw_1$

$dw_1=\frac{dL}{da}\frac {da}{dz}\frac{dz}{dw_1}$

$\space \space \space \space \space \space \space \space =\frac{d( -[y^{(i)} ln(\hat y^{(i)}) + (1-y^{(i)})ln(1-\hat y^{(i)})])}{da}\frac {da}{dz}\frac{dz}{dw_1}$