实验数据:20newsgroups
Newsgroups最早由Lang于1995收集并在[Lang 1995]中使用。它含有20000篇左右的Usenet文档,几乎平均分配20个不同的新闻组。除了其中4.5%的文档属于两个或两个以上的新闻组以外,其余文档仅属于一个新闻组,因此它通常被作为单标注分类问题来处理。Newsgroups已经成为文本分及聚类中常用的文档集。美国MIT大学Jason
Rennie对Newsgroups作了必要的处理,使得每个文档只属于一个新闻组,形成Newsgroups-18828。
可以先用其他的分类器对20newsgroups进行实验,因为后面肯定有对比实验,所以可以先积累
问题:从sklearn中导入的数据集是18846条新闻
分类器:多隐层极限学习机
已有代码,但是是mnist手写识别的,读懂后再改