自然语言处理(三)语言模型

本文详细介绍了自然语言处理中的语言模型,包括基本概念、n元文法、参数估计、数据平滑以及性能评价。重点讨论了n-gram的优缺点,并探讨了基于缓存和混合方法的改进语言模型,旨在提高模型的适应性和预测准确性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

语言模型基本概念

用数学的方法描述语言规律,即用句子 S = w 1 , w 2 … w n S = w_1,w_2\dots w_n S=w1,w2wn的概率 p ( S ) p(S) p(S)刻画句子的合理性.

对语句合理性判断:

  • 规则法:判断是否合乎语法、语义(定性分析)
  • 概率统计法:通过可能性大小来判断(定量计算)

模型思想
p ( S ) = p ( w 1 ) p ( w 2 ∣ w 1 ) … p ( w n ∣ w 1 … w n − 1 ) = ∑ i = 1 n p ( w i ∣ w 1 ⋯ w − 1 ) p(S) = p(w_1)p(w_2|w_1)\dots p(w_n|w_1\dots w_{n-1}) = \sum_{i=1}^np(w_i|w_1\cdots w_{-_1}) p(S)=p(w1)p(w2w1)p(wnw1wn1)=i=1np(wiw1w

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值