NLP
文章平均质量分 65
RICH LIANG
合肥工业大学电子商务研究所博士研究生在读
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
pytorch构建LSTM分类器用于IMDB情感分类
本文基于pytorch构建LSTM情感分类分类器,在IMDB数据集上进行测试,涉及文本预处理、数据集加载、模型训练、保存、测试等过程。原创 2021-04-16 16:28:39 · 4918 阅读 · 12 评论 -
Python Gensim文本分析——从文本预处理到TFIDF、LDA建模分析
本文以中文文本数据作为分析对象,针对中文文本存在的特征进行文本预处理,并调用Gensim工具包实现对文本的TFIDF建模已经LDA建模,从文本中抽取出的特征进行表征文本信息,可用于后续文本相似度、个性化推荐等研究。原创 2020-03-26 23:46:44 · 6007 阅读 · 2 评论 -
Java中文文本预处理:Jieba分词,并去除停用词
文本数据是自然语言处理的重要数据来源,对于中文文本而言,由于其特殊性,常常需要对文本进行分词,本文针对中文文本,利用Java对其进行分词,并去除停用词。原创 2019-08-01 10:20:33 · 11066 阅读 · 2 评论
分享