第4关:逻辑回归模型及其应用
任务描述
本关任务:以澳大利亚信贷批准数据集为本关数据集,划分前600为训练数据集,后90数据为测试数据集,利用逻辑回归模型预测及输出准确率。
相关知识
为了完成本关任务,你需要掌握:1.如何读取数据集,2.如何准确划分训练和测试数据集,3.如何利用逻辑回归进行预测及准确率的输出。
读取数据集
读取数据集是个基本功,导入pandas包,进行数据读取 示例如下:
import pandas as pd
df=pd.read_excel('数据集')
划分训练和测试数据集
划分数据集,就是将数据集分成两部分,我们可以考虑用切片实现数据集的划分。需要注意的是数据的划分需要分开特征数据和预测变量。列如,训练用的特征数据集用x表示,预测数据用y表示,测试数据则用x1,y1。 示例如下:
x=df.iloc[:600,:15].values
y=df.iloc[:600,15].values
x1=df.iloc[600:,:15].values
y1=df.iloc[600:,15].values
如何利用逻辑回归模型预测及准确率分析
1.导入逻辑回归模型板块命名为LR 2.利