深度学习基础（一）：logistic分类

最新推荐文章于 2023-12-24 18:56:06 发布

原创

最新推荐文章于 2023-12-24 18:56:06 发布 · 607 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

这篇博客主要介绍深度学习中的logistic分类，包括线性求和与sigmoid函数、误差计算与参数修正，以及如何将logistic分类扩展到多类别问题。作者强调logistic分类在神经网络中的基础地位，并通过实例解释了训练过程和优化目标。

这个系列主要记录我在学习各个深度学习算法时候的笔记，因为之前已经学过大概的概念，所以这轮学习比较着重于公式推导和具体实现，而对概念上的描述不多，因此比较适合对此有一定基础的同学。

在正式开始写深度学习的知识之前，会有两节传统神经网络的内容，因为深度学习中大量运用了以往神经网络的知识。搞懂传统的神经网络如何工作是很有必要的，有助于对之后的学习打下坚实的基础。

1. logistic分类

几乎所有的教材都是从logistic分类开始的，因为logistic分类实在太经典，而且是神经网络的基本组成部分，每个神经元(cell)都可以看做是进行了一次logistic分类。

所谓logistic分类，顾名思义，逻辑分类，是一种二分类法，能将数据分成0和1两类。

logistic分类的流程比较简单，主要有线性求和，sigmoid函数激活，计算误差，修正参数这4个步骤。前两部用于判断，后两步用于修正。本文分为3部分，前2部分讲普通logistic分类的流程，第三部分则稍作扩展。

1.1 线性求和以及sigmoid函数

第1,2步是用于根据输入来判断分类的，所以放在一起说。假设有一个n维的输入列向量 x ，也有一个n维的参数列向量 h ，还有一个偏置量b，那么就可以线性求和得到z.

z = h T x + b

此时因为z的值域是 [−∞,+∞] ，是无法根据z来判断 x 到底是属于0还是1的。因此我们需要一个函数，来将z的值映射到[0,1]之间，这就是激活函数。激活函数有很多种，这里的激活函数是sigmoid函数。

σ (x) = 1 1 + e - x σ' (x) = σ (x) (1 - σ (x))

其形状为

图1 sigmoid函数
可以看到x越大，

σ(x) 越接近1，反之，则越接近0. 那么在判断的时候，我们首先对之前得到的z代入sigmoid函数

a = σ (z) = σ (h T x + b)

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。