【Python】数据挖掘与机器学习(一)
大家好 我是寸铁👊
总结了一篇【Python】数据挖掘与机器学习(一)sparkles:
喜欢的小伙伴可以点点关注 💝
【实验1】预测鲍鱼年龄
问题描述
请从一份数据中预测鲍鱼的年龄,数据集在abalone.cvs中,数据集一共有4177 个样本,每个样本有9个特征。其中rings为鲍鱼环数,鲍鱼每一年长一环,类似树轮,是预测
变量,sex属性已经经过处理,M=1表示雄性、F=-1表示雌性、I=0表示幼体。 有9列数据,分别是:


要求
(1)给出回归模型,给出线性回归模型的回归系数,以及
(2)需要分训练数据与测试数据,采用训练数据学习,给出R2,采用测试数据计算MSE.
代码
import sklearn
import tensorflow as tf
import numpy as np
import pandas
import sklearn.model_selection as ms
import matplotlib.pyplot as plt
def main():
df = pandas.read_csv('abalone.csv')
df = df.values
y = df[:, [-1]].astype('float32') # 提取第9 列
x = df[:, 1:8].astype('float32') # 提取1-8 列
sex = df[:, 0].astype('float32') # 取出第0 列,后续要转换成2 个哑元
male = sex == 1
female = sex == -1
oneMa = np.zeros((len(sex), 1), dtype='float32') # 雄性
oneFe = np.zeros((len(sex), 1), dtype='float32') # 雌性
oneMa[male] = 1
oneFe[female] = 1
ones = np.ones((len(x), 1), dtype='float32') # 全是 1 的向量
x = np.hstack((on
Python数据挖掘与机器学习实战:预测鲍鱼年龄与听力实验

本文介绍了如何使用Python进行数据挖掘,包括实验1中的鲍鱼年龄预测,通过线性回归模型分析特征并划分训练测试集,计算R2和MSE;以及实验2中关于成年男性听力实验的数据可视化和Logistic回归模型的构建,评估模型性能。
最低0.47元/天 解锁文章
579

被折叠的 条评论
为什么被折叠?



