1. 下载fetch_20newsgroups的压缩包
下载地址 http://qwone.com/~jason/20Newsgroups/20news-bydate.tar.gz
先需要到以上的地址下载fetch_20newsgroups的压缩包
下载后的压缩包名字应该为20news-bydate.tar.gz
将压缩包放入C:\Users\(自己的电脑名)\scikit_learn_data\20news_home\中
2. 修改代码
首先找到自己的虚拟环境中的文件:
“.\DataAnalysis\Lib\site-packages\sklearn\datasets_twenty_newsgroups.py”
打开文件修改其中的代码
使用Ctrl + F 搜索def _download_20newsgroups(target_dir, cache_path):
修改以下代码
将其注释,并修改archive_path,添加20news-bydate.tar.gz的地址。
3. 重新加载数据集
# 1. 导入数据集