本文主要介绍使用keras对IMDB评论进行分类。
示例代码:
import keras
from keras.datasets import imdb
import numpy as np
from keras.models import Sequential
from keras.layers import Dense
from keras.optimizers import RMSprop
from keras import losses
from keras import metrics
import matplotlib.pyplot as plt
'''
加载数据
num_words=1000:表示只保留训练数据中最常出现的10000个单词
train_data和test_data是评论列表,数据里的单词序列已被转换为整数序列,每个整数代表字典中的特定单词
train_labels和test_labels是0和1的列表,其中0表示‘负面评论’,1表示‘正面评论’
'''
(train_data, train_labels), (test_data, test_labels) = imdb.load_data(num_words=10000)
# print('data0:', train_data[0], 'label0:', train_labels[0])
# print(max([max(sequence) for sequence in train_data]))
# 将评论解码回到英文单词
# word_index是将单词映射到整数索引的字典
word_index = imdb.get_word_index()
# print(word_index)
# 将word_i