
自然语言处理(NLP)
文章平均质量分 92
记录NLP中的算法实现与实践
幼稚的人呐
工欲善其事,必先利其器!
展开
-
发现新词 | NLP之无监督方式构建词库(四)
考虑多字的内部凝聚度;基于kenlm与trie树做了性能优化转载 2022-09-15 13:50:00 · 931 阅读 · 0 评论 -
发现新词 | NLP之无监督方式构建词库(三)
考虑多字的内部凝固度,在每个ngrams中只保留高于对应阈值的片段,生成集合n_grams_;用n_grams_对语料进行切分,宁放过勿切错,生成初始字典;对初始字典进行回溯转载 2022-09-09 16:17:50 · 604 阅读 · 0 评论 -
PyTorch实战 | 文本情感分类任务 | LSTM与LSTM+Attention | TextCNN
基于双向LSTM与双向LSTM+Attention的文本情感分类任务;基于TextCNN的文本情感分类任务原创 2022-08-30 19:19:54 · 6032 阅读 · 4 评论 -
发现新词 | NLP之无监督方式构建词库(二)
考虑相邻两字的互信息熵,如果小于阈值,则表示不能成词,从中间切开,最后,对切分出来的片段进行统计,就可以发现新词!转载 2022-08-17 16:58:02 · 785 阅读 · 1 评论 -
发现新词 | NLP之无监督方式构建词库(一)
电商领域文本利用无监督方式发现未登录词转载 2022-08-10 19:21:54 · 1430 阅读 · 0 评论