N-gram 语言模型

最新推荐文章于 2025-07-12 21:56:38 发布

原创

最新推荐文章于 2025-07-12 21:56:38 发布 · 1.8k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#自然语言处理 #n-gram

n-gram模型是自然语言处理中的一种方法，通过考虑前后文的n个词汇来预测下一个词出现的概率。从uni-gram到tri-gram，模型复杂度逐渐增加，效果也相应提升。为了解决数据稀疏导致的零概率问题，可以采用数据平滑技术。常见的应用包括智能输入法如智能狂拼、微软拼音。语言模型还可以通过缓存、混合方法或最大熵模型进行自适应改进。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

n 元文法(n-gram)模型。

通常地，当n=1时，即出现在第i位上的基元wi独立于历史；一元文法也被写为uni-gram或monogram。

当 n=2 时，2-gram(bi-gram) 被称为1阶马尔可夫链。

当 n=3 时，3-gram(tri-gram)被称为2阶马尔可夫链。

依次类推。

为了保证条件概率在 i=1 时有意义，同时为了保证句子内所有字符串的概率和为 1，即可以在句子首尾两端增加两个标志: <BOS>w1 w2 w3 w4……wm <EOS>

如果汉字的总数为:N

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄12年

100
原创

74
点赞

379
收藏

111
粉丝

关注

私信

热门文章

分类专栏

计算机系统结构 17篇
人工智能 1篇
机器学习 24篇
神经网络 1篇
自然语言处理 3篇
大数据 15篇
python 9篇
C++ 2篇
Java 3篇
Scala 7篇
Linux 12篇
线性代数 2篇
科学计算 2篇
最优化理论 1篇
开源硬件 9篇
算法 2篇
网络 9篇
TensorFlow 1篇
汇编语言 2篇
安全 1篇
其他 1篇

展开全部收起

上一篇：: 交叉熵相对熵

下一篇：: 神经网络语言模型

最新评论

开源硬件介绍
搞硬件的，: 有开源硬件模块的，比如OCM，OTII等硬件设计规范，都是开源硬件的一种，具有一定的通用性，
特征工程（补充）--特征组合
Bullet@: 可以具体谈谈是怎么样让特征加减乘除组合的吗？
sklearn：点互信息和互信息
weixin_41980031: 补充说明点互信息也可以通过Sklearn的build in function 来写代码如下 [code=python] from sklearn import feature_selection as fs # xtrain是features # ytrain是labels # 返回的是一个每个features的PMI值的matrix PMI = fs.mutual_info_classif(xtrain,ytrain) [/code]
sklearn：点互信息和互信息
weixin_41980031: 补充说明点互信息也可以通过Sklearn的build in function 来写代码如下 [code=python] from sklearn import feature_selection as fs # xtrain是features # ytrain是labels # 返回的是一个每个features的PMI值的matrix PMI = fs.mutual_info_classif(xtrain,ytrain) [/code]
sklearn：点互信息和互信息
weixin_41980031: 补充说明点互信息也可以通过Sklearn的build in function 来写代码如下 [code=python] from sklearn import feature_selection as fs # xtrain是features # ytrain是labels # 返回的是一个每个features的PMI值的matrix PMI = fs.mutual_info_classif(xtrain,ytrain) [/code]

大家在看

嵌入式硬件篇---麦克纳姆轮的稳定 350

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。