【Python】数据挖掘与机器学习(一)
大家好 我是寸铁👊
总结了一篇【Python】数据挖掘与机器学习(一)sparkles:
喜欢的小伙伴可以点点关注 💝
【实验1】预测鲍鱼年龄
问题描述
请从一份数据中预测鲍鱼的年龄,数据集在abalone.cvs中,数据集一共有4177 个样本,每个样本有9个特征。其中rings为鲍鱼环数,鲍鱼每一年长一环,类似树轮,是预测
变量,sex属性已经经过处理,M=1表示雄性、F=-1表示雌性、I=0表示幼体。 有9列数据,分别是:
要求
(1)给出回归模型,给出线性回归模型的回归系数,以及
(2)需要分训练数据与测试数据,采用训练数据学习,给出R2,采用测试数据计算MSE.
代码
import sklearn
import tensorflow as tf
import numpy as np
import pandas
import sklearn.model_selection as ms
import matplotlib.pyplot as plt
def main():
df = pandas.read_csv('abalone.csv')
df = df.values
y = df[:, [-1]].astype('float32') # 提取第9 列
x = df[:, 1:8].astype('float32') # 提取1-8 列
sex = df[:, 0].astype('float32') # 取出第0 列,后续要转换成2 个哑元
male = sex == 1
female = sex == -1
oneMa = np.zeros((len(sex), 1), dtype='float32') # 雄性
oneFe = np.zeros((len(sex), 1), dtype='float32') # 雌性
oneMa[male] = 1
oneFe[female] = 1
ones = np.ones((len(x), 1), dtype='float32') # 全是 1 的向量
x = np.hstack((on