- 博客(1)
- 收藏
- 关注
原创 写一段python代码,可以将.csv的数据集分成训练集,测试集,开发集,比例大小为8:1:1
这段代码首先使用pandas库中的read_csv()函数来读取csv文件并存储在一个DataFrame对象中。然后调用sklearn.model_selection库中的train_test_split()函数来将数据集划分为80%的训练集和20%的开发测试集。接下来,再次使用train_test_split()函数将开发测试集分为50%的开发集和50%的测试集。最后,将三个数据集(即train.csv, test.csv和dev.csv)分别保存到本地磁盘上。
2023-04-12 19:57:41
629
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人