Python学习笔记 新闻分类:单标签多分类问题
在执行import命令的时候疯狂报错,说无法从网站上下载数据。于是手动输入该网址(https://s3.amazonaws.com/text-datasets/reuters.npz)下载。得到文件reuters.npz,放入文件夹 /home/你的用户名/.keras/datasets 中,再import就可以了。
#Jupyter引入以使用matplotlib
%matplotlib inline
#导入数据集
from keras.datasets import reuters
(train_data, train_labels), (test_data, test_labels) = reuters.load_data(
num_words=10000)
#将索引解码为新闻文本
word_index = reuters.get_word_index()
reverse_word_index = dict([(value, key) for (key, value) in word_index.items()])
decoded_newswire = ' '.join([reverse_word_index.get(i - 3, '?') for i in
train_data[0]])
#将训练和测试标签向量化
from keras.utils.np_utils import to_categorical
one_hot_train_labels = to_categorical(train_labels)
one_hot_test_labels = to_categorical(test_labels)
向量化前后: