提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
X_train,X_test,y_train,y_test
前言
X_train,X_test,y_train,y_test各自的用处到底是啥?
例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。
提示:以下是本篇文章正文内容,下面案例可供参考
#一、X_train,X_test,y_train,y_test各自的意义
①Xtrain 和 Ytrain都是原始数据,用于fit,即用于训练,Xtrain 和 Ytrain都是经过数据分割出来的,一般按照7:3到8:2的比例进行划分。
②而Xtest 和 Ytest不是用来训练的数据,那他们被划分出来的意义是什么?
这部分的数据不参与模型的训练,而是用于评价训练出来的模型好坏,score评分的时候用。
二、数据划分方法
test_size=0.2 测试集的划分比例。如果为浮点型,则在0.0-1.0之间,代表测试集的比例;如果为整数型,则为测试集样本的绝对数量;如果没有,则为训练集的补充。
random_state:是随机数的种子。固定随机种子时,同样的代码,得到的训练集数据相同。不固定随机种子时,同样的代码,得到的训练集数据不同
希望有用