西湖大学自然语言处理(六)—— 语言模型 语言模型一元语言模型二元语言模型三元语言模型生成模型 语言模型 语言模型(LM)通过更简单的模式来度量自然语言句子的概率 一元语言模型 估算每个词在语料库中的概率,以此来获得一句话的概率 存在问题及解决方法: 二元语言模型 Unigram语言模型在比较“他吃了披萨”和“他喝了披萨”时存在问题,这需要动词-宾语关系 存在问题及解决办法: 三元语言模型 解决稀疏问题的方法: 为什么用对数概率? 生成模型 马尔可夫模型