Python数据挖掘入门与实践 第二章2.1 关于random_state

本文探讨了Python数据挖掘中random_state参数的影响,通过实验展示了不同random_state值下test_size保持不变但准确率波动的情况。作者通过代码验证了random_state设定后,样本切分顺序固定,但具体测试集样本位置会变化,进一步确认了random_state的作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

random_state

之前的文章自己给自己挖了个坑,现在尝试来解决一下。
根据之前的代码,来看看,random_state的取值在0-20的时候,
是否会改变test_size和准确率。

import numpy as np
import csv
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import cross_val_score
from matplotlib import pyplot as plt 

data_filename = r'下载地址\ionosphere.data'
X = np.zeros((351, 34), dtype='float')
y = np.zeros((351,), dtype='bool')

with open(data_filename, 'r') as input_file:
	reader = csv.reader(input_file)
	for i, row in enumerate(reader):
		data = [
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值