- 博客(0)
- 资源 (3)
- 收藏
- 关注
imdb_dataset.zip
该数据集为imdb的文本二分类数据集,从keras下载之后,将句子都还原为了英文单词,并将训练集和测试集都保存为了pickle格式,命名为imdb_train_rawtext.pkl和imdb_test_rawtext.pkl;
原始的keras上下载的数据集每个词都直接用序号表示,不适合使用BERT等预训练模型来处理,因此发布了该版本;
压缩包中同样包括了原始的imdb数据集,便于网速不好的同学直接下载使用;
2020-02-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅