train_test_split的用法（参考别人加自己使用）

原创于 2021-06-16 20:48:49 发布 · 397 阅读

CC 4.0 BY-SA版权

文章标签：

本文详细介绍了sklearn库中model_selection模块的train_test_split函数，该函数用于将数据集划分为训练集和测试集。文章解释了函数参数的意义，包括特征集合X、标签集合y、测试集比例test_size及随机数种子random_state，并说明了返回值包括训练集、测试集、训练标签和测试标签。

新的sklearn库中，次函数的用法从cross_validation.train_test_split变成了model_selection.train_test_split

X_train,X_test, y_train, y_test =model_selection.train_test_split(X,y,test_size, random_state)

名称	意义
X	带划分样本的特征集合
y	带划分样本的标签集合
test_size	测试集占总样本的比例，若为整数就是测试集的数量
random_state	随机数种子

返回的就是训练集、测试集、训练标签和测试标签。