新的sklearn库中,次函数的用法从cross_validation.train_test_split变成了model_selection.train_test_split
X_train,X_test, y_train, y_test =model_selection.train_test_split(X,y,test_size, random_state)
| 名称 | 意义 |
| X | 带划分样本的特征集合 |
| y | 带划分样本的标签集合 |
| test_size | 测试集占总样本的比例,若为整数就是测试集的数量 |
| random_state |
随机数种子 |
返回的就是训练集、测试集、训练标签和测试标签 。
本文详细介绍了sklearn库中model_selection模块的train_test_split函数,该函数用于将数据集划分为训练集和测试集。文章解释了函数参数的意义,包括特征集合X、标签集合y、测试集比例test_size及随机数种子random_state,并说明了返回值包括训练集、测试集、训练标签和测试标签。

被折叠的 条评论
为什么被折叠?



