
step1: 引入必要的库。Numpy(数学函数)和Pandas(引用和管理数据集)是两个基本的库
import Numpy as np
import Pandas as pd
step2:引入数据集。用pandas中的read_csv方法读取数据作为数据帧;然后分别得到自变量和因变量的矩阵和向量。
datasets = pd.read_csv('Data.csv')
X = datasets.iloc(:,:-1)
Y = datasets
本文详细介绍了机器学习中的数据预处理过程,包括引入必要的库如Numpy和Pandas,使用Pandas的read_csv读取数据,处理丢失的数据,用Imputer填充平均值或中间值,解析分类数据,利用LabelEncoder进行转换,以及如何将数据划分为训练集和测试集,最后讲解了特征缩放的重要性,推荐使用StandardScaler进行标准化处理。

step1: 引入必要的库。Numpy(数学函数)和Pandas(引用和管理数据集)是两个基本的库
import Numpy as np
import Pandas as pd
step2:引入数据集。用pandas中的read_csv方法读取数据作为数据帧;然后分别得到自变量和因变量的矩阵和向量。
datasets = pd.read_csv('Data.csv')
X = datasets.iloc(:,:-1)
Y = datasets
4916
1358

被折叠的 条评论
为什么被折叠?