scikit-learn特征选择

本文介绍了scikit-learn库中的train_test_split函数,用于数据集的划分,以及numpy库中的np.random.uniform和np.random.choice函数,用于生成随机数和随机样本。train_test_split通过设置test_size和random_state参数实现训练集和测试集的划分。np.random.uniform生成指定范围内的均匀分布随机数,np.random.choice则能从给定序列中随机选择元素。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

重要函数摘抄:
train_test_split
np.random.uniform
np.random.choice
np.random.normal
一、train_test_split
导入
from sklearn.model_selection import train_test_split
语法
X_train,X_test,Y_train,Y_test = train_test_split(train_data,train_target,test_size=0.25,random_state=0)
含义
train_test_split是交叉验证中常用的函数,功能是从样本中随机地按比例选取train_data和test_data;
参数test_size和training_size是指允许指定放入测试/训练集中的数据的百分比;
random_state可以接受一个Numpy RandomState生成器或一个整数种子,为了保证程序每次运行都分割一样的训练集和测试集。
二、np.random.uniform,np.random.choice
导入
from numpy import np
语法
X = np.random.uniform(x,y,size=(a,b))
Y = np.random.choice((‘Male’,‘Female’),size=©)
含义
np.random.uniform(x,y,size=(a,b)),随机生成x和y之间的数,构成size为(a,b)的数组;
np.random.choice((‘Male’,‘Female’),size=©),随机从集合(‘Male’,‘Female’)中选择一个,组成size为©的数组;其中(‘Male’,‘Female’)也可以是数字,如5,也可以是range(5).
三、np.random.normal()
导入
from numpy import np
语法
np.random.normal(loc=0.0,scale=1.0,size=None)
含义
Dram random samples from a normal (Gaussian) distribution.
loc = mean,均值;scale = standard,标准差;
size=Output shape, If the given shape is, e.g., (m, n, k), then m * n * k samples are drawn.
Returns:ndarray(多维数组) or scalar(标量)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值