【Python】数据挖掘与机器学习(一)

Python数据挖掘与机器学习实战：预测鲍鱼年龄与听力实验

原创

于 2024-04-07 11:00:00 发布 · 3.2k 阅读

57 ·

CC 4.0 BY-SA版权

文章标签：

#python #数据挖掘 #机器学习 #实验

本文介绍了如何使用Python进行数据挖掘，包括实验1中的鲍鱼年龄预测，通过线性回归模型分析特征并划分训练测试集，计算R2和MSE；以及实验2中关于成年男性听力实验的数据可视化和Logistic回归模型的构建，评估模型性能。

【Python】数据挖掘与机器学习(一)

大家好我是寸铁👊
总结了一篇【Python】数据挖掘与机器学习(一)sparkles:
喜欢的小伙伴可以点点关注 💝

【实验1】预测鲍鱼年龄

问题描述

请从一份数据中预测鲍鱼的年龄，数据集在abalone.cvs中，数据集一共有4177 个样本，每个样本有9个特征。其中rings为鲍鱼环数，鲍鱼每一年长一环，类似树轮，是预测
变量，sex属性已经经过处理，M=1表示雄性、F=-1表示雌性、I=0表示幼体。有9列数据，分别是:

在这里插入图片描述

要求

(1)给出回归模型，给出线性回归模型的回归系数，以及
(2)需要分训练数据与测试数据，采用训练数据学习，给出R2，采用测试数据计算MSE.

代码

import sklearn
import tensorflow as tf
import numpy as np
import pandas
import sklearn.model_selection as ms
import matplotlib.pyplot as plt


def main():
    df = pandas.read_csv('abalone.csv')
    df = df.values

    y = df[:, [-1]].astype('float32')  # 提取第9 列
    x = df[:, 1:8].astype('float32')  # 提取1-8 列
    sex = df[:, 0].astype('float32')  # 取出第0 列，后续要转换成2 个哑元
    male = sex == 1
    female = sex == -1
    oneMa = np.zeros((len(sex), 1), dtype='float32')  # 雄性
    oneFe = np.zeros((len(sex), 1), dtype='float32')  # 雌性
    oneMa[male] = 1
    oneFe[female] = 1
    ones = np.ones((len(x), 1), dtype='float32')  # 全是 1 的向量
    x = np.hstack((on