- Spyder是Python(x,y)的作者为它开发的一个简单的集成开发环境。和其他的Python开发环境相比,它最大的优点就是模仿MATLAB的“工作空间”的功能,可以很方便地观察和修改数组的值。(安装过了就不重新安装了(o°ω°o)
Python环境下
- 在Spyder中导入标准库:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
- 导入数据集(在File explorer把路径切换到数据集所在位置):
dataset=pd.read_csv('Data.csv')
-
在Variable explorer中可以点击查看数据集内容:

-
设置自变量矩阵:
X = dataset.iloc[:, :-1].values
表示把数据集的所有行和除了最后一列外的所有列赋值给自变量矩阵X。

- 设置因变量向量:
y = dataset.iloc[:, 3].values
表示把数据集的所有行和最后一列(本数据集中最后一列为第3列)赋值给因变量向量y。

-
缺失数据(Mi

本文介绍了在Python的Spyder环境中和R环境下进行机器学习数据预处理的步骤,包括导入数据集、处理缺失数据、分类数据转换、特征缩放等操作。在Python中,使用Spyder的Variable explorer查看数据,并通过平均值填充缺失值;在R中,通过平均值处理缺失数据并使用特定包处理分类数据。同时,文章提到了将数据集划分为训练集和测试集的重要步骤。
最低0.47元/天 解锁文章
772

被折叠的 条评论
为什么被折叠?



