机器学习手撕代码(0)数据

机器学习代码实现:数据预处理与准备
这篇博客主要介绍了机器学习项目中数据预处理的步骤,包括数据读取、清洗、合并以及随机排列。作者提供了一个简洁的Python类`DataSet`用于处理kaggle葡萄酒预测数据集,并分享了如何导入和准备数据,为后续的模型训练做好铺垫。代码已做最大简化,方便读者直接使用。

机器学习手撕代码(0)数据

  • 后面连续几篇博客把之前没写完的几个经典机器学习算法代码补了补,尽量精简了代码量,欢迎找bug。
  • 这第0篇主要是说一下一些数据格式之类的准备,保证代码复制回去就能跑通。

文件树就是下面这个样子,不必须,import数据集文件没问题就行。
在这里插入图片描述

数据来源:kaggle葡萄酒预测
datasets文件夹下面放一个dataset.py文件,后面所有的模型都用这一个数据集。

dataset.py

import pandas as pd
import numpy as np


class DataSet:
    def __init__(self,path,mode='cla',rad_seed = 2021):
        data = pd.read_csv(path)
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值