Python 运行出现：pandas attribute error : no attribute ‘Factor‘ found解决方案（转载）

最新推荐文章于 2024-03-11 11:40:50 发布

一定要好好学习呀~~！！！

最新推荐文章于 2024-03-11 11:40:50 发布

阅读量394

点赞数 1

文章标签：机器学习 tensorflow 深度学习

原文链接：https://blog.youkuaiyun.com/qq_36556893/article/details/82852599

版权

Python 运行出现：pandas attribute error : no attribute ‘Factor’ found解决方案（转载）

一、遇到的问题## 标题

博主在做随机森林的学习运行代码出现一下错误：

from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestClassifier
import pandas as pd
import numpy as np
 
iris = load_iris()
df = pd.DataFrame(iris.data, columns=iris.feature_names)
df['is_train'] = np.random.uniform(0, 1, len(df)) <= .75
df['species'] = pd.Factor(iris.target, iris.target_names)
df.head()
 
train, test = df[df['is_train']==True], df[df['is_train']==False]
 
features = df.columns[:4]
clf = RandomForestClassifier(n_jobs=2)
y, _ = pd.factorize(train['species'])
clf.fit(train[features], y)
 
preds = iris.target_names[clf.predict(test[features])]
pd.crosstab(test['species'], preds, rownames=['actual'], colnames=['preds'])

错误：

    File "test_iris_with_rf.py", line 9, in <module>
        df['species'] = pd.Factor(iris.target, iris.target_names)
    AttributeError: 'module' object has no attribute 'Factor'

发现这是因为pandas版本太新了…

将

pd.Factor(iris.target, iris.target_names)

改为

pd.Categorical.from_codes(iris.target, iris.target_names)

转载自：https://blog.youkuaiyun.com/qq_36556893/article/details/82852599