机器学习特征值特征抽取

原创已于 2023-08-01 19:24:02 修改 · 1k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #python #人工智能

于 2018-10-24 21:30:43 首次发布

机器学习同时被 2 个专栏收录

10 篇文章

订阅专栏

人工智能

7 篇文章

订阅专栏

根据文本的的特征值，进行特征值的抽取

from sklearn.feature_extraction import DictVectorizer
from sklearn.feature_extraction.text import CountVectorizer

def countvec():
    """
    对文本进行特征值化
    """
    cv = CountVectorizer()
    # 把数据返回给data
    data = cv.fit_transform(["life is short,i like python","life is too long,i dislike python"])
    
    # 打印data的值
    print("打印data的值：")
    print(data)
    
    # 统计所有文章中点给钱所有的词，重复只看做一次
    print(cv.get_feature_names())
    
    
    # 对每篇文章，在词的列表里面进行统计每个词出现的次数，单个字母不进行统计
    print("将数据转换成数组形式：")
    print(data.toarray())
    
    
    return None


if __name__ == "__main__":
    countvec()

在这里插入图片描述