线性分类:线性分类和线性回归有啥关系?简单介绍感知机

本文介绍了线性分类的基本概念,它与线性回归的区别在于处理离散的输出变量。线性分类通过激活函数将线性回归转化为分类任务,分为硬输出和软输出两种模式。硬输出如感知机,寻找超平面进行二分类;软输出如逻辑回归,输出连续概率。感知机的激活函数为符号函数,实现简单分类。文章还提及了作者的新书和数据科学相关的交流群信息。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >



公众号后台回复“图书“,了解更多号主新书内容
     作者:NK冬至
     来源:首席数据可虚假

 对于分类问题,线性分类则是最最基础的内容之一。

要讲线性分类,必先了解线性回归。线性回归的因变量Y是连续值,而当Y是离散值的时候,则明显不能直接用线性回归的方法解决了。这就是线性分类要解决的问题。

关于线性回归,可以参考之前文章《线性回归基础介绍》。而相较于分类问题,另一类问题就是聚类问题,关于聚类问题可以参考之前的《K-means聚类方法介绍》《层次聚类方法介绍》

01

线性分类概述及类别

首先聊聊线性分类的整体概况。

(1)线性分类和线性回归的关系

线性回归和线性分类啥关系呢?

文章开始的时候,我们其实讲到了,回归解决的是连续变量的问题,即Y值是连续的。而分类是离散变量,即Y值是离散的。那线性回归和线性分类有啥关系呢?看下图:

总结起来,在线性回归的基础上,加上一个激活函数(或者通过降维的方式),就可以实现线性分类了。

(2)线性分类的具体方式

上面我们看到了,连接线性回归和线性分类中的关键环节,就是激活函数。基于激活函数的不同输出特性,我们将线性分类细分为两种模式:硬输出式分类和软输出式分类

什么是硬分类呢?

其实就是激活函数的输出,是直接的分类结果(比如样本1属于A类,样本2属于B类)。常见的机器学习模型有线性判别分析感知机

软分类就是输出的结果是连续的概率值(比如样本1属于A类的概率是0.78),我们根据概率值再来判定具体的类别。常见的机器学习模型有逻辑回归朴素贝叶斯等。

02


感知机模型

上文中,已经提到硬分类中,有一种分类模型是感知机。

(1)感知机概述

首先简单介绍一下感知机。

感知机其实是比较朴素的一种机器分类模型。其实就是在下图中找到一条线(或者多维里的一个平面),将样本空间分为两类。

当然,对于非线性可分的情况,感知机是不适应的。

(2)激活函数

感知机分类算法的激活函数如下:

对,其实就是常见的符号函数。

具体过程参考下图:

这个图其实是一个比较形象化的过程。

首先对于每个变量赋予权重,然后进行求和。将求和以后的整体代入到激活函数中,如果大于0则取1,小于0则取0,这样则实现了两分类。基于此,进行样本数据的训练,获得具体的权重向量。

◆ ◆ ◆  ◆ ◆麟哥新书已经在当当上架了,我写了本书:《拿下Offer-数据分析师求职面试指南》,目前当当正在举行活动,大家可以用相当于原价5折的预购价格购买,还是非常划算的:






数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。
管理员二维码:
猜你喜欢
● 卧槽!原来爬取B站弹幕这么简单● 厉害了!麟哥新书登顶京东销量排行榜!● 笑死人不偿命的知乎沙雕问题排行榜
● 用Python扒出B站那些“惊为天人”的阿婆主!● 你相信逛B站也能学编程吗
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值