method one :
sklearn中shuffle的方法。
- from sklearn.utils import shuffle
- df = shuffle(df)
对df进行shuffle。其中参数frac是要返回的比例.
- df.sample(frac=1)
需要打混后数据集的index(索引)还是按照正常的排序。我们只需要这样操作
- df.sample(frac=1).reset_index(drop=True)
本文介绍了两种使用Python在sklearn库中实现数据集打乱的方法:一是利用sklearn.utils模块中的shuffle方法;二是通过DataFrame的sample方法并设置参数frac为1来实现。此外,还介绍了一种在打乱数据后重新设置索引的方法。
method one :
sklearn中shuffle的方法。
对df进行shuffle。其中参数frac是要返回的比例.
需要打混后数据集的index(索引)还是按照正常的排序。我们只需要这样操作
3961
4415

被折叠的 条评论
为什么被折叠?