特征转换
最近在看《PYTHON机器学习及实践+从零开始通往KAGGLE竞赛之路》这本书,
书中采用最简单直接的方式介绍了机器学习的入门实践语句,简单介绍原理以后,就开始代码实现了。
刚好看到一个例子,关于DictVectorizer的使用,很是喜欢这种操作方式,代码如下:
from sklearn.feature_extraction import DictVectorizer
dict_vec = DictVectorizer(sparse=False)# #sparse=False意思是不产生稀疏矩阵
X_train = dict_vec.fit_transform(X_train.to_dict(orient='record'))
X_test = dict_vec.transform(X_test.to_dict(orient='record'))
print(dict_vec.feature_names_)#查看转换后的列名
print(X_train)#查看转换后的训练集