语言模型中unigram、bigram、trigram的概念
unigram 一元分词,把句子分成一个一个的汉字
bigram 二元分词,把句子从头到尾每两个字组成一个词语
trigram 三元分词,把句子从头到尾每三个字组成一个词语.
softword :视情况而定的分词?????
分词技术详解
本文介绍了语言模型中的三种分词技术:unigram一元分词、bigram二元分词及trigram三元分词,并解释了它们如何应用于句子的拆分。
语言模型中unigram、bigram、trigram的概念
unigram 一元分词,把句子分成一个一个的汉字
bigram 二元分词,把句子从头到尾每两个字组成一个词语
trigram 三元分词,把句子从头到尾每三个字组成一个词语.
softword :视情况而定的分词?????
4273
4806
1793

被折叠的 条评论
为什么被折叠?