关于sklearn.datasets.fetch_20newsgroups下载报错的问题
在尝试互联网新闻分类的时候,我遇到了这样一个问题: 实验中需要用到sklearn.datasets里新闻数据抓取器fetch_20newsgroups, 而参数subset设置为 ‘all’ 时, 则会报出需要下载14MB数据集的问题。
众所周知,Python下载东西的速度是真的慢,何况这次的大小还是14MB!
当你报下面这个错误的时候,不要惊慌,跟着我一步一步来。
1、 你需要到这里下载一个压缩包: 20new-sbydate.tar.gz.
这里我将它保存到云盘下,有需要的读者可以自取:链接:云盘资源:提取码为dzlx
2、 下载完成后,你的文件名应该是 20newsbydate.tar.gz ,请注意!在这里需要将这个文件更名为: 20new-sbydate.tar.gz (原因是通过Python下载的文件和自己下载的文件名略有不同)
3、 在我的电脑 C:\Users(你的