数据分析时,我们经常会有这样的需求:将数据集按某一个维度拆分成若干数据子集、创建多个变量。如果手动去实现,工作量较大。我们可以通过locals()配合循环语句来实现这一需求。我们以鸢尾花数据集为例,我们按照花的种类将数据集拆分成数据子集,分别放到不同的变量中去。实现代码如下:
from sklearn.datasets import load_iris
iris = load_iris()
X = iris.data
y = iris.target
for i in range(3):
locals()['iris_'+str(i)] = X[y == i]
参考文献:
https://cloud.tencent.com/developer/ask/53504
https://www.cnblogs.com/wanxsb/archive/2013/05/07/3064783.html
本文介绍了一种利用Python的locals()函数结合循环语句,高效地将数据集按特定维度拆分成多个子集并存储到不同变量中的方法。以鸢尾花数据集为例,展示了如何根据花的种类自动创建三个数据子集。
3949

被折叠的 条评论
为什么被折叠?



