将读取的数据分为测试数据和训练数据

最新推荐文章于 2022-11-18 16:50:49 发布

原创最新推荐文章于 2022-11-18 16:50:49 发布 · 4k 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#将读取数据分为测试和训练 #python

基本方法专栏收录该内容

16 篇文章

订阅专栏

本文提供了一个简单直观的方法来划分读取的数据集，通过使用Python的sklearn库中的cross_validation模块，演示了如何将数据集划分为训练集和测试集，比例为80%用于训练，20%用于测试。此教程适用于初学者，旨在帮助理解和实践数据集划分的基本概念。

网上找了好多页没有找到如何把数据分开的代码，我今天给大家写一个比较简单的把读取的数据分开的方法

#encoding：utf-8

#从sklearn包中导入cross_balidation包
from sklearn import cross_validation 

X_train, X_test,Y_train, Y_test = cross_validation.train_test_split(X1_scaled,Y1_scaled,test_size=0.2, random_state=0) 
#将数据分为训练的X_train, Y_train, 训练的X_test, X_train.
#X1_scaled,是读取数据的X的值，Y1_scaled是读取数据的Y值#test_siza = 0.2是把20%给测试，80%给训练。

这是一个非常简单的讲读取的数据分开的方法，希望对大家有用

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

MachineLearningAI

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

7篇1章3节：详析训练数据集、测试数据集和验证数据集及其划分策略

DAT｜R科学与人工智能

10-25

1160

本文探讨多种数据划分策略，如70/30、80/20、75/25和60/20/20，各具适用场景和优缺点。这些策略帮助研究人员合理选择训练、验证和测试数据集。最后，我们将通过R语言对iris数据集进行具体示范，展示如何实现这些划分策略及其在模型开发中的应用效果。

使用sklearn将数据集分为训练集和测试集

1 条评论

陨落星辰wjj 2018.01.21
博主会出现下面的警告能指点一下吗 C:\Python34\lib\site-packages\sklearn\cross_validation.py:41: DeprecationWarning: This module was deprecated in version 0.18 in favor of the model_selection module into which all the refactored classes and functions are moved. Also note that the interface of the new CV iterators are different from that of this module. This module will be removed in 0.20. "This module will be removed in 0.20.", DeprecationWarning)