《Python 深度学习》3.5 新闻分类:多分类问题(代码)

该博客展示了如何利用深度学习的多分类模型,特别是使用Keras库,对路透社新闻数据集进行46个类别的分类。首先,数据被加载、解码和编码,接着构建了一个包含两个隐藏层的神经网络模型,并用softmax激活函数进行多分类。模型经过训练和验证,最终在测试集上达到了约78%的精度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Classifying newswires: a multi-class classification example

本节会构建一个网络,将路透社新闻划分为 46 个互斥的主题。因为有多个类别,所以这是多分类(multiclass classification)问题的一个例子。因为每个数据点只能划分到一个类别,所以更具体地说,这是单标签、多分类(single-label, multiclass classification)问题的一个例子。如果每个数据点可以划分到多个类别(主题),那它就是一个多标签、多分类(multilabel, multiclass classification)问题。

  (由于是在Jupyter Notebook上直接copy下来的,所以使用时请记得注意。)

## 1. 加载路透社数据集

from tensorflow.keras.datasets import reuters
(train_data, train_labels), (test_data, test_labels) = reuters.load_data(num_words=10000)

len(train_data)

len(test_data)

train_data[10]

##  2. 将索引解码为新闻文本

word_index=reuters.get_word_index()
reverse_word_index=dict([(value,key) for (key,value) in word_index.items()])
decoded_newswire="".join([reverse_word_index.get(i-3,"?") for i in train_data[0]]) 
#注意,索引减去了3,因为0、1、
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值