在处理nlp数据时,通常将文本处理成词在字典中的序号组成的序列,在tensorflow中直接使用下面的函数from tensorflow.contrib import learn#加载模型,利用训练语料形成的字典
vocab_processor=learn.preprocessing.VocabularyProcessor.restore('vocab')vocab_processor=learn.preprocessing.VocabularyProcessor(max_document_length=mean_document_length,min_frequency=5)
x=np.array(list(vocab_processor.fit_transform(x_text)))
本文介绍如何使用TensorFlow中的VocabularyProcessor进行自然语言处理任务中的文本预处理工作,包括构建词汇表、转换文本为词汇ID序列等关键步骤。
1065

被折叠的 条评论
为什么被折叠?



