http://scikit-learn.org/stable/modules/feature_extraction.html
带病在网吧里。。。。。。写,求支持。。。
1、首先澄清两个概念:特征提取和特征选择(
Feature extraction is very different from Feature selection
)。the former consists in transforming arbitrary data, such as text or images, into numerical features usable for machine learning. The latter is a machine learning technique applied on these features(从已经提取的特征中选择更好的特征).
下面分为四大部分来讲,主要还是4、text feature extraction
2、loading features form dicts
class DictVectorizer。举个例子就好:

本文详细探讨了scikit-learn中的特征提取,包括DictVectorizer进行字典特征转换,FeatureHasher利用哈希技巧高效编码,重点介绍了文本特征提取的原理,并提及了图像特征提取中的patch提取和像素连接性分析。对于机器学习初学者,本文是掌握特征预处理的重要资源。
最低0.47元/天 解锁文章
663

被折叠的 条评论
为什么被折叠?



