机器学习手撕代码(0)数据
- 后面连续几篇博客把之前没写完的几个经典机器学习算法代码补了补,尽量精简了代码量,欢迎找bug。
- 这第0篇主要是说一下一些数据格式之类的准备,保证代码复制回去就能跑通。
文件树就是下面这个样子,不必须,import数据集文件没问题就行。

数据来源:kaggle葡萄酒预测
datasets文件夹下面放一个dataset.py文件,后面所有的模型都用这一个数据集。
dataset.py
import pandas as pd
import numpy as np
class DataSet:
def __init__(self,path,mode='cla',rad_seed = 2021):
data = pd.read_csv(path)
机器学习代码实现:数据预处理与准备

这篇博客主要介绍了机器学习项目中数据预处理的步骤,包括数据读取、清洗、合并以及随机排列。作者提供了一个简洁的Python类`DataSet`用于处理kaggle葡萄酒预测数据集,并分享了如何导入和准备数据,为后续的模型训练做好铺垫。代码已做最大简化,方便读者直接使用。
最低0.47元/天 解锁文章
796

被折叠的 条评论
为什么被折叠?



