IMDB
数据集:它包含来自互联网电影数据库(
IMDB
)的
50 000
条严重两极分化的评论。数据集被分为用于训练的 25 000
条评论与用于测试的
25000
条评论,训练集和测试集都包含50%的正面评论和
50%
的负面评论。以下是数据集示例:

#从数据库导入数据集。train_data和test_data指的是由评论组成的列表,每个单词都被编码为一串数字
#train_data和test_labels是由0,1组成的列表,代表评论是正面还是负面。
#num_words=10000指的是仅仅保留数据集中前10000个高频词,低频词被舍弃
from tenso
#train_data和test_labels是由0,1组成的列表,代表评论是正面还是负面。
#num_words=10000指的是仅仅保留数据集中前10000个高频词,低频词被舍弃
from tenso