# coding:utf-8
"""
logistic 回归, 自动建模
"""
import pandas as pd
# 参数初始化
filename = r"C:\learning\DataMining\Book\Python_DataMining\Data\chapter5\demo\data\bankloan.xls"
data = pd.read_excel(filename)
x = data.iloc[:, : 8].as_matrix() # 此处的 [:, : 8] 的意思是,切片所有的行和 1- 8列的数据 # 此处的 as_matrix 函数是
# 将数据框数据结构转换为使用数组的数据结构
print "x: \n", x
y = data.iloc[:, 8].as_matrix() # 此处的 [:, 8] 的意思是, 切片所有的行和第 9 列 ,注:这里的数字实际上是第 n 列 - 1
print "y: \n", y
from sklearn.linear_model import LogisticRegression as LR
from sklearn.linear_model import RandomizedLogisticRegression as RLR
rlr = RLR() # 建立随机逻辑回归模型,筛选变量 # 可以使用参数设置阈值: selection_threshold = 0.5 等
rlr.fit(x, y) # 训练模型
rlr.get_support() # 获取特征筛选结果,也可以通过 .scoress_方法获取各个特征的分数
print u"通过随机逻辑回归模型筛选特征结束"
print u"有效特征为: %s " % ",".join(data.columns[rlr.get_su
『Python数据分析与挖掘实战』第五章:挖掘建模
最新推荐文章于 2024-07-11 08:05:31 发布