机器学习自学笔记（2） -- 字典特征抽取

悠然;̀͒̏ۖ

于 2020-06-29 15:36:08 发布

阅读量4.2k

点赞数

文章标签：机器学习 python

本文链接：https://blog.youkuaiyun.com/qq_44886056/article/details/107021019

版权

特征抽取

将任意数据转化成可用于机器学习的特征数据。

字典特征提取

使用APIsklearn.feature_extraction对字典提取时，使用DictVectorizer方法。
可以把字典转化成二维数组（矩阵）。
示例：


from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction import DictVectorizer

def dict_demo():
    """
    字典特征抽取
    :return:
    """
    data = [{"city":"北京","tem":100},{"city":"上海","tem":53},{"city":"武汉","tem":65}]
    #实例化一个转化类
    transfer = DictVectorizer(sparse=False)
    #调用feat_transform()
    data_new = transfer.fit_transform(data)
    print(transfer.get_feature_names())
    print(data_new)
    return None

if __name__ == '__main__':
    #字典特征抽取
    dict_demo()