from sklearn.feature_extraction.text import CountVectorizer
sklearn.feature_extraction类做文本特征提取,有CountVectorizer、TfidfVectorizer、TfidfTransformer、HashingVectorizer四种类。前两种常见。主要说CountVectorizer。
CountVectorizer函数,属于常见的特征数值计算类,是一个文本特征提取方法。对于每一个训练文本,它只考...
原创
2019-11-05 20:40:43 ·
7085 阅读 ·
1 评论