《数学之美(第一版)》笔记 ——第3章

本文是《数学之美》第一版中第3章的笔记,主要探讨了统计语言模型在自然语言处理中的应用,如机器翻译、语音识别等。介绍了隐式马尔科夫模型(HMM)的一元模型计算过程以及高阶模型的局限性,讨论了零概率问题和平滑方法,如古德-图灵估计,以解决统计样本不足时的概率估计问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第3章:统计语言模型

  • 自 然 语 言 从 它 产 生 开 始 , 逐 渐 演 变 成 一 种上 下 文 相 关 的 信 息 表 达 和 传 递 的 方 式 , 因 此 让 计 算 机 处 理 自 然 语 言 , 一个 基 本 的 问 题 就 是 为 自 然 语 言 这 种 上 下 文 相 关 的 特 性 建 立 数 学 模 型 。 这个 数 学 模 型 就 是 在 自 然 语 言 处 理 中 常 说 的 **统 计 语 言 模 型 ( Statistical Language Model ) **, 它 是 今 天 所 有 自 然 语 言 处 理 的 基 础 , 并 且 广 泛 应 用于 机 器 翻 译 、 语 音 识 别 、 印 刷 体 或 手 写 体 识 别 、 拼 写 纠 错 、 汉 字 输 入 和文 献 查 询 。

  • 判断一个文字序列是否合乎文法、含义是否正确等,贾里尼克的做法是:一个句子是否合理,就看看它的可能性大小如何
    在这里插入图片描述

关于隐式马尔科夫模型:在这里插入图片描述
  • 计算过程(1元模型 1-gram model):

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值