python 随机抽样划分数据集

最新推荐文章于 2025-05-07 22:40:54 发布

人生就是不断的奋斗呀

最新推荐文章于 2025-05-07 22:40:54 发布

阅读量7k

点赞数

CC 4.0 BY-SA版权

分类专栏：数据清洗

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_40127170/article/details/82842082

数据清洗专栏收录该内容

4 篇文章

订阅专栏

本文介绍了一种使用Python pandas库高效划分数据集的方法，通过随机抽样实现数据集的AB榜划分，确保了数据的随机性和独立性，适用于机器学习项目的数据预处理阶段。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

比如说划分AB榜，随机各占50%

A榜：

dfA=df1.sample(frac=0.5,random_state=6)

#按50%划分并设置随机数种子

B榜：

rowlist=[]
for indexs in dfA.index:
rowlist.append(indexs)
dfB=df1.drop(rowlist,axis=0)

dfA.to_csv('A榜.csv',encoding='utf-8-sig',index=False)
dfB.to_csv('B榜.csv',encoding='utf-8-sig',index=False)

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。