逻辑回归实战准备-优快云博客

博客主要围绕逻辑回归展开，先进行分类散点图可视化，展示未区分类别和区分类别的散点图。接着介绍逻辑回归模型的使用，包括引入库、读入数据，然后建立型数据集，最后对模型进行评估，如计算准确率、可视化模型表现等。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、分类散点图可视化

1.分类散点图可视化：
未区分类别散点图：plt.scatter(X1,X2)
区分类别散点图：
mask=y==1
passed=plt.scatter(X1[mask],X2[mask])
failed=plt.scatter(X1[_mask]，X2[mask],marker=‘^’)。

在这里插入图片描述

模型训练：

from sklearn.linear_model import LogisticRegression
lr_model = LogisticRegression()
lr_model.fit(x,y)

边界函数系数：

theta1,theta2 = lr_model.coef_[0][0],lr_model.coef_[0][1]
theta0 = LR.intercept_[0]

对新数据做预测：

predictions = lr_model.predict(x)

在这里插入图片描述
生成新的属性数据：

代码如下（示例）：

data = pd.read_csv(
    'https://labfile.oss.aliyuncs.com/courses/1283/adult.data.csv')
print(data.head())

在这里插入图片描述

评估模型表现：
在这里插入图片描述计算准确率：

from sklearn.metrics import accuracy_score
y_predict = lr_model.predict(X)
accuracy = accuracy_score(y,y_predict)

画图看决策边界效果，可视化模型表现：

plt.plot(x1,x2_boundary)
passed = plt.scatter（X1[mask],X2[mask]）
failed = plt.scatter(X1[~mask],X2[~mask],maker='^')