SVC真实数据案例:预测明天是否会下雨
导库导数据,探索特征
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
weather = pd.read_csv(r"D:\机器学习\sklearn\08支持向量机下\weatherAUS5000.csv",index_col=0)
weather.head()
#将特征矩阵和标签Y分开
X = weather.iloc[:,:-1]
Y = weather.iloc[:,-1]
#分裂的快捷键:ctrl shift -
#合并的快捷键:shift M
X.shape #5000行是我随机选的
#探索数据类型
X.info()
#探索缺失值
X.isnull().mean() #缺失值所占总值的比例 isnull().sum(全部的True)/X.shape[0]
#我们要有不同的缺失值填补策略
#在下方添加一个新的cell ESC b enter
#在上方添加一个新的cell ESC a enter
#删除一个cell ESC d d
Y.shape
Y.isnull().sum() #加和的时候,True是1,False是0
#探索标签的分类
np.unique(Y) #我们的标签是二分类