支持向量机与基于树的算法在分类任务中的应用
1. 支持向量机新闻主题分类
支持向量机(SVM)在新闻主题分类中表现出色。通过网格搜索,我们可以找到最优的参数组合,从而提高分类的准确性。
例如,在一个新闻主题分类任务中,我们使用了以下参数:
'tfidf__max_features': 40000, 'svc__C': 1,
'tfidf__sublinear_tf': True
经过网格搜索,我们得到了最佳得分:
>>> grid_search.best_score_
0.88836839314124094
然后,我们使用最佳估计器对测试集进行分类,并得到了测试集的准确率:
>>> pipeline_best = grid_search.best_estimator_
>>> accuracy = pipeline_best.score(cleaned_test, label_test)
>>> print('The accuracy on testing set is: {0:.1f}%'.format(accuracy*100))
The accuracy on testing set is: 80.6%
这个结果表明,使用支持向量机进行新闻主题分类是有效的。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



