Python的lasso回归分析

加载调用函数包

import numpy as np # 快速操作结构数组的工具
import pandas
import matplotlib.pyplot as plt  # 可视化绘制
from sklearn.linear_model import Lasso,LassoCV,LassoLarsCV   

数据读取

data = pd.read_csv('C://Users//TD//Desktop//data0629.csv')
相关系数查看
data.corr()

选择变量相关性系数较好的,可以作为进一步参考分析。

归一化处理

利用均值和标准差进行数据归一化处理,克服量纲的影响。

import numpy as np
arr_mean = np.mean(data) #求均值
arr_std = np.std(data,ddof=1) #求标准差
newdata=(data-arr_mean )/arr_std 

分组抽样划分训练集和测试集

X = newdata[["年龄","性别","重点病种名称编码","住院总费用","科室名称编码","确诊天数","门诊与入院诊断符合情况","住院是否超30天","术前住院日","手术季度","手术日期与出院日时差天数","手术级别程度编码","是否重返医院","检验时长"]]
Y = 
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值