机器学习入门(九):逻辑回归——非线性逻辑函数的由来

本文介绍了逻辑回归模型的起源和发展,从指数增长模型出发,通过修正项形成逻辑函数,最终得到Sigmoid函数。逻辑回归虽然名字中有“回归”,实际上是一种常用的分类模型。Sigmoid函数因其S形曲线,常被称为Sigmoid或逻辑函数,用于表示概率。文章还探讨了线性与非线性关系,并强调了理论学习在机器学习中的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

逻辑回归

今天我们要讲的模型叫做 Logistic Regression (LR),一般翻译为逻辑回归。

LR 是一种简单、高效的常用分类模型——有点奇怪是吧,为什么名字叫做“回归”却是一个分类模型,这个我们稍后再讲。先来看看这个 LR 本身。

LR 的模型函数记作:y=h(x),具体形式如下:

hθ(x)=11+e−θTx

对应到一元自变量的形式为:

h(x)=11+e−(a+bx)

设 z=a+bx,则:

h(z)=11+e−z

这样的一个函数被称为逻辑函数,它在二维坐标中的表现是这样的:


v2-83d269bf3f08b015c6ea7321bd27b4a3_b.jpg


因为表现为 S 形曲线,所以逻辑函数又被称为 Sigmoid 函数(S 函数)。

Sigmoid 这样一个奇怪而别扭的形式到底是谁、因为什么想出来的呢?又怎么想到用它来做分类的呢?

罗马不是一天建成的,Sigmoid 函数也不是一天形成的。

说起来,逻辑回归的历史相当悠久,迄今大概已经有200年。它的前身,则在18世纪就已经出现了。

18世纪,随着工业革命的深入;世界经济、科技的发展;美洲的发现,以及随之而来的大移民和北美人口迅猛增长……各个学科对于统计学的工具性需求越来越强烈。

到了19世纪,为了研究人口增长以及化学催化反应与时间的关系,人们发明了逻辑函数。

指数增长

最初,学者们将人口(或者化合物)数量与时间的函数定义为 W(t) —— 其中自变量 t 表示时间, W(t) 表示人口/化合物数量。

W(t) 表示的是存量,则 W(t) 对 t 求微分的结果 W′(t) 就代表了人口/化合物的增长率。

因此增长率函数 W′(t)=dW(t)dt。

最简单的假设是:W′(t) 与 W(t) 成正比,也就是有:W′(t)=bW(t)。

我们知道指数函数 f(

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值