使用机器学习方法 做文档的自动分类
套路:
1.根据每个文件 生成该文件的一个特征
2.根据特征 选择 分类器 进行文本分类
3.(可选)根据 2 步结果,调整参数/特征等
Python实现朴素贝叶斯文本分类
这篇博客介绍了如何使用Python和nltk、jieba库进行文本自动分类,主要步骤包括文件特征生成、朴素贝叶斯分类器的应用。作者通过搜狗文本分类语料库进行了实践,并探讨了数据清洗、特征选择和处理时间的问题。
使用机器学习方法 做文档的自动分类
套路:
1.根据每个文件 生成该文件的一个特征
2.根据特征 选择 分类器 进行文本分类
3.(可选)根据 2 步结果,调整参数/特征等
1万+

被折叠的 条评论
为什么被折叠?