《Python 深度学习》3.5 新闻分类：多分类问题（代码）

布拉格沃兹基硕德

于 2021-10-30 15:31:13 发布

阅读量766

点赞数

分类专栏： Tensorflow Python 文章标签： python 深度学习分类

本文链接：https://blog.youkuaiyun.com/baidu_30506559/article/details/121051683

版权

该博客展示了如何利用深度学习的多分类模型，特别是使用Keras库，对路透社新闻数据集进行46个类别的分类。首先，数据被加载、解码和编码，接着构建了一个包含两个隐藏层的神经网络模型，并用softmax激活函数进行多分类。模型经过训练和验证，最终在测试集上达到了约78%的精度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Classifying newswires: a multi-class classification example

本节会构建一个网络，将路透社新闻划分为 46 个互斥的主题。因为有多个类别，所以这是多分类（multiclass classification）问题的一个例子。因为每个数据点只能划分到一个类别，所以更具体地说，这是单标签、多分类（single-label, multiclass classification）问题的一个例子。如果每个数据点可以划分到多个类别（主题），那它就是一个多标签、多分类（multilabel, multiclass classification）问题。

（由于是在Jupyter Notebook上直接copy下来的，所以使用时请记得注意。）

## 1. 加载路透社数据集

from tensorflow.keras.datasets import reuters
(train_data, train_labels), (test_data, test_labels) = reuters.load_data(num_words=10000)

len(train_data)

len(test_data)

train_data[10]

##  2. 将索引解码为新闻文本

word_index=reuters.get_word_index()
reverse_word_index=dict([(value,key) for (key,value) in word_index.items()])
decoded_newswire="".join([reverse_word_index.get(i-3,"?") for i in train_data[0]]) 
#注意，索引减去了3，因为0、1、

最低0.47元/天解锁文章