【机器学习小记】【Logistic回归】deeplearning.ai course1 2nd week programming

原创于 2021-01-16 22:34:32 发布 · 229 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#神经网络 #python

初学深度学习专栏收录该内容

12 篇文章

订阅专栏

具有神经网络思维的Logistic回归

数据集介绍
- 数据拉平后
模型搭建
参数初始化
前向传播
反向传播
梯度下降更新参数
前向传播-预测predict
建议
- 其他
结果

目标：搭建一个能够【识别猫】的简单的神经网络

参考自：【中文】【吴恩达课后编程作业】Course 1 - 神经网络和深度学习 - 第二周作业

数据集介绍

train_set_x_orig ：保存的是训练集里面的图像数据（本训练集有209张64x64的图像）。
train_set_y_orig ：保存的是训练集的图像对应的分类值（【0 | 1】，0表示不是猫，1表示是猫）。
test_set_x_orig：保存的是测试集里面的图像数据（本训练集有50张64x64的图像）。
test_set_y_orig ：保存的是测试集的图像对应的分类值（【0 | 1】，0表示不是猫，1表示是猫）。
classes ：保存的是以bytes类型保存的两个字符串数据，数据为：[b’non-cat’ b’cat’]。

图像是209张大小为64*64的三通道图片，把图像【拉平】，【标准化】之后，即可用于训练

数据拉平后

训练集降维最后的维度： (12288, 209)
训练集_标签的维数 : (1, 209)
测试集降维之后的维度: (12288, 50)
测试集_标签的维数 : (1, 50)

模型搭建

这里搭建的是简单的Logistic回归，即只有1层的神经网络（输入层不算），且仅有一个结点

对于一张图片（一个样本的训练）

参数初始化

初始化 $w$ 和 $b$

w太大，会导致梯度消失；w随机数乘以0.001之后就正常了

为什么w可以设置为0矩阵？

如果w = 0矩阵，同一层的多个神经元的计算结果相同，增加结点就没有意义了。但是在本例中，只有一个神经元，因而初始化为0与初始化随机数结论一样

前向传播

线性变换之后得到的值z：
$w$ 是形状为(12288,1)的矩阵
$z^{(i)} = w^Tx^{(i)} + b$
激活值：
$\hat y^{(i)} = a^{(i)} = sigmoid(z^{(i)})$
损失函数：
$L(a^{(i)},y^{(i)}) = -y^{(i)}\log(a^{(i)}) - (1-y^{(i)})\log(1-a^{(i)})$
成本函数：
$\over m} \displaystyle\sum_{i=1}^n L(a^{(i)},y^{(i)})$

反向传播

$\over da} = -{y\over a} + {(1-y) \over (1-a)}$
$\over dz} = a(1-a)$
所以，
$\over dz} = a - y$
$\over dw} = x * dz^T$
$\over db} = dz$

梯度下降更新参数

$\alpha$ 为学习率
$\alpha dw$
$\alpha db$
前向传播，反向传播，迭代n次，记录每一步的【成本函数】cost

前向传播-预测predict

经过 $s i g m o i d$ 函数之后，输出的概率在[0,1)之间。
将概率转换成【独热编码】one-hot encoding。
如果概率>0.5输出1，否则输出0

建议

在python中，将代码写在一个main函数下，然后在if __name__ == '__main__': 下调用，而不是直接写成【语句】的形式，如：

def main():
	pass
# 主函数入口
if __name__ == '__main__':
    main()

这样写的好处是，避免了python的变量作用域问题。 ~~python变量没有类型，写得好难受~~

其他

函数返回值可以用assert来检查返回值是否正常，返回一个元组 or 字典
1.1 assert(如果为假，就报错)
可以用reshape提醒数组的维度
2.1 reshape([])表示这是一个数
squeeze可以压缩没有用到的维度,如
3.1 [[1,4]] = > [1,4]
3.2 [1] => 1
plt.plot(二维数组，对应的标签），多次plt.plot()之后，用plt.show()显示

结果

在这里插入图片描述

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。