初识逻辑回归算法*

最新推荐文章于 2024-04-30 04:29:38 发布

原创最新推荐文章于 2024-04-30 04:29:38 发布 · 215 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #python

本文介绍了逻辑回归的基本概念，它是一个用于分类的模型，尤其适用于二分类问题。逻辑回归通过Sigmoid函数实现决策边界，当预测值大于等于0.5时分类为1，否则分类为0。在实践中，利用鸢尾花数据集展示了如何进行数据预处理和逻辑回归模型的训练与预测。

初识逻辑回归算法

1、逻辑回归简介

逻辑回归（Logistic regression，简称LR）虽然其中带有"回归"两个字，但逻辑回归其实是一个分类模型，并且广泛应用于各个领域之中。虽然现在深度学习相对于这些传统方法更为火热，但实则这些传统方法由于其独特的优势依然广泛应用于各个领域中。

2、逻辑回归原理

当z≥0 时,y≥0.5,分类为1，当 z<0时,y<0.5,分类为0，其对应的y值我们可以视为类别1的概率预测值。Logistic回归虽然名字里带“回归”，但是它实际上是一种分类方法，主要用于两分类问题（即输出只有两种，分别代表两个类别），所以利用了Logistic函数（或称为Sigmoid函数），函数形式为：
在这里插入图片描述我们可以发现 Logistic 函数是单调递增函数，并且在z=0时将回归方程写入其中为：
故可推导得到：
从而可总结得到：
逻辑回归从其原理上来说，逻辑回归其实是实现了一个决策边界：对于函数，当z≥0 时,y≥0.5,分类为1，当 z<0时,y<0.5,分类为0，其对应的y值我们可以视为类别1的概率预测值。

对于模型的训练而言：实质上来说就是利用数据求解出对应的模型的特定的ω。从而得到一个针对于当前数据的特征逻辑回归模型。
而对于多分类而言，将多个二分类的逻辑回归组合，即可实现多分类。

3、基于鸢尾花（iris）数据集的逻辑回归分类实践
Step1：函数库导入

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

Step2：数据读取/载入

##我们利用sklearn中自带的iris数据作为数据载入，并利用Pandas转化为DataFrame格式
from sklearn.datasets import load_iris
data = load_iris() #得到数据特征
iris_target = data.target #得到数据对应的标签
iris_features = pd.DataFrame(data=data.data, columns=data.feature_names) #利用Pandas转化为DataFrame格式

Step3：数据信息简单查看

##利用.info()查看数据的整体信息
iris_features.info()

##<class’pandas.core.frame.DataFrame’>
##RangeIndex:150entries,0to149
##Datacolumns(total4columns):
###ColumnNon-NullCountDtype
##----------------------------
##0sepallength(cm)150non-nullfloat64
##1sepalwidth(cm)150non-nullfloat64
##2petallength(cm)150non-nullfloat64
##3petalwidth(cm)150non-nullfloat64
##dtypes:float64(4)
##memoryusage:4.8KB

Step4:可视化描述

Step5:利用逻辑回归模型在二分类上进行训练和预测