【二 自然语言处理基础技术】【2.2 语言模型:n-gram、神经网络语言模型】

在这里插入图片描述

上周我家楼下奶茶店出了个奇葩规定——用网络流行语点单可以打五折。当我听到00后店员面不改色地说出"尊贵的绝绝子要暴风吸入一杯yyds吗"时,突然意识到:当代人类的语言系统已经进入量子态,而让机器理解这些黑话的幕后推手,正是我们今天要盘点的语言模型。


一、文字界的算命先生:n-gram模型

如果把语言模型比作武侠世界,n-gram就是那套人人都会的太祖长拳。别看现在被深度学习按在地上摩擦,当年可是撑起了整个NLP江湖的半边天。

1.1 来自上古互联网的预言术

想象你穿越回2003年的网吧,看到有人用智能ABC输入法在QQ聊天。当时那个会预测"你好"之后接"吗"的傻白甜系统,就是n-gram的祖传手艺。它的核心理念简单到令人发指:通过统计前n个词出现的概率,预测下一个词。

比如"宫廷玉液酒"后面接"一百八一杯"的概率,在赵丽蓉老师的小品文本中高达99.99%。这套算法就像菜市场大妈,永远在碎碎念:“我瞅着这几个字经常扎堆出现…”

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

再见孙悟空_

你的鼓励将是我最大的动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值