import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model.logistic import LogisticRegression
from sklearn.preprocessing import StandardScaler
# 模型评估
from sklearn.metrics import classification_report
# auc指标计算
from sklearn.metrics import roc_auc_score
# 加载数据
data = pd.read_csv('breast-cancer-wisconsin.data', encoding='gbk')
# print(data)
# 列名称
columns = ['Sample code number', 'Clump Thickness', 'Uniformity of Cell Size', 'Uniformity of Cell Shape',
'Marginal Adhesion', 'Single Epithelial Cell Size', 'Bare Nuclei', 'Bland Chromatin', 'Normal Nucleoli',
'Mitoses', 'Class:']
# 替换列名称
data.columns = columns
# 先将数据转化为df
data = pd.DataFrame(data)
# print(data)
# 将空值?转化为np.nan类型
data.replace('?', np.nan, inplace=True)
data.dropna(how='any', axis=0, inplace=True)
# print(data)
# 数据标准化处理
# 进行数据集拆分
# 选取特征值
x = data.iloc[:, 1:10].values
y = data.iloc[:, -1].values
# print(type(x))
# 进行数据及拆分
# 返回特征值
线性逻辑回归以及稳健性测试
最新推荐文章于 2025-09-22 16:15:51 发布
本文深入探讨了线性逻辑回归模型的原理,包括如何建立模型、参数估计以及解释预测结果。同时,文章强调了在实际应用中进行稳健性测试的重要性,详细阐述了多种稳健性检验方法,如替换缺失值策略、调整模型假设和对比不同回归方法的稳定性,以确保模型的可靠性和泛化能力。

最低0.47元/天 解锁文章
1746

被折叠的 条评论
为什么被折叠?



