【一周算法实践集训】_【模型构建】_baseline

本文介绍了如何使用Python的pandas和sklearn库进行数据预处理,包括读取CSV文件、划分训练集和测试集,以及利用逻辑回归模型进行预测并评估模型性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

读取数据

import pandas as pd
data_all = pd.read_csv('data_all.csv',encoding='gbk')  # encoding='gbk' 解决编码问题

划分数据集

# 划分训练集测试集
from sklearn.model_selection import train_test_split
features = [x for x in data_all.columns if x not in ['status']]
X = data_all[features]
y = data_all['status']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3,random_state=2018)

构建模型

# 逻辑回归模型
from sklearn.linear_model import LogisticRegression
lr = LogisticRegression(random_state =2018)
lr.fit(X_train, y_train)

模型评分

lr.score(X_test,y_test)
# 0.7484232655921513
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值