【报错解决01】分层抽样报错ValueError: The least populated class in y has only 1 member

以下程序解决的是python分层抽样问题,采用的数据集是一些股票的开盘价最高价等14个变量的信息。

根据网上的参考我的代码是这样的:

from sklearn.model_selection import train_test_split
import numpy as np
import pandas as pd
data=pd.read_csv('D:\PROGRAM\hs300if0915.txt',sep='\t')
stratified_sample, _ = train_test_split(data,train_size=0.2, stratify=data['open']) 
return stratified_sample

但是会报错说

ValueError: The least populated class in y has only 1 member, which is too few. The minimum number of groups for any class cannot be less than 2.

查了一下说train_test_split仅应该关于离散或分类变量进行分层。(参考文章的http://cn.voidcc.com/question/p-efrnblbp-tp.html

然后我把倒数第二行中的代码stratify=data['open']改为

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值