【Python】数据挖掘与机器学习(一)

本文介绍了如何使用Python进行数据挖掘,包括实验1中的鲍鱼年龄预测,通过线性回归模型分析特征并划分训练测试集,计算R2和MSE;以及实验2中关于成年男性听力实验的数据可视化和Logistic回归模型的构建,评估模型性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

【Python】数据挖掘与机器学习(一)

大家好 我是寸铁👊
总结了一篇【Python】数据挖掘与机器学习(一)sparkles:
喜欢的小伙伴可以点点关注 💝


【实验1】预测鲍鱼年龄

问题描述

请从一份数据中预测鲍鱼的年龄,数据集在abalone.cvs中,数据集一共有4177 个样本,每个样本有9个特征。其中rings为鲍鱼环数,鲍鱼每一年长一环,类似树轮,是预测
变量,sex属性已经经过处理,M=1表示雄性、F=-1表示雌性、I=0表示幼体。 有9列数据,分别是:

在这里插入图片描述

在这里插入图片描述


要求

(1)给出回归模型,给出线性回归模型的回归系数,以及
(2)需要分训练数据与测试数据,采用训练数据学习,给出R2,采用测试数据计算MSE.


代码

import sklearn
import tensorflow as tf
import numpy as np
import pandas
import sklearn.model_selection as ms
import matplotlib.pyplot as plt


def main():
    df = pandas.read_csv('abalone.csv')
    df = df.values

    y = df[:, [-1]].astype('float32')  # 提取第9 列
    x = df[:, 1:8].astype('float32')  # 提取1-8 列
    sex = df[:, 0].astype('float32')  # 取出第0 列,后续要转换成2 个哑元
    male = sex == 1
    female = sex == -1
    oneMa = np.zeros((len(sex), 1), dtype='float32')  # 雄性
    oneFe = np.zeros((len(sex), 1), dtype='float32')  # 雌性
    oneMa[male] = 1
    oneFe[female] = 1
    ones = np.ones((len(x), 1), dtype='float32')  # 全是 1 的向量
    x = np.hstack((on
评论 45
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

寸 铁

感谢您的支持!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值