随机森林划分训练集与测试集(随机划分、自定义划分)-Python实现

本文介绍如何根据需求自定义划分及使用随机方法划分机器学习的训练集和测试集,主要使用Python进行操作。训练集和测试集的样本分布已知,分别保存在CSV文件中,便于后续模型训练和验证。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本部分是根据需求 自定义人为划分训练集和测试集,随机划分样本可见上一篇博客。

如有错误之处,欢迎批评指正~

因为是人为规定哪些样本是训练集,哪些样本是测试集,因此训练集和测试集不是随机的,是我们已知的。因此我将训练集和测试集分别放置在两个CSV文档中。
下图是训练集的部分原始数据。第一列是图像编号,中间列是图像特征,最后一列是图像的实际分类结果。(80张图像)
在这里插入图片描述下图是测试集的部分原始数据:(20张图像)
在这里插入图片描述
实际运行过程中可以提前将number列也就是图像编号列给删去,这里为了方便大家理解,就不删除啦~~

代码如下:(我用anaconda实现的哦~)

import pandas as pd
import numpy as np
#将训练集和测试集分别放在两个CSV文件中,并分别读取。
train=pd.read_csv('data-train.csv')
test=pd.read_csv('data-test.csv')
#定义训练集与测试集中的特征和分类结果
y_train=np.array(train['actual'])
x_train=train.drop('actual',axis=1)
y_test=np.array(test['actual'])
x_test=test.drop('actual',axis=1)

print(y_train.shape,x_train.shape,y_test.shape,x_test.shape)

上部分代码的运行结果:

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值