线性回归糖尿病预测

from sklearn import datasets  # 此模块包含了很多用于机器学习的数据集。
diabetes = datasets.load_diabetes()  # 使用load_diabetes函数加载糖尿病数据集。

# 该数据集包含442行数据和10个属性值,分别是年龄(Age)、性别(Sex)、体质指数(Body    mass index)、平均血压(Average Blood Pressure)和一年后疾病级数指标(S1~S6)。
# Target是一年后患疾病的定量指标,适合用于回归任务

print(datasets)  # 糖尿病数据
x_data = diabetes.data  # 获取特征数据
# diabetes_data是通过pandas库中的read_csv函数读取名为diabetes.csv的数据文件得到的数据集。
# 这个数据集包含了关于葡萄糖、血压、皮肤厚度、胰岛素、身体质量指数等特征的信息
y_data = diabetes.target  # 获取目标数据
print('特征数据:\n',x_data)
# (442,10)442个数据,每行数据有10个特征数据,相当于y=a1 x1+a2 x2+...a10 x10
print(x_data.shape)
print('目标数据:\n',y_data)
print(y_data.shape)

# 把数据集拆分成:训练集和测试集
from sklearn.model_selection import train_test_split  # 用于将数据集拆分为训练集和测试集。 train训练,test测试,split拆分
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值