[模式识别].(希腊)西奥多里蒂斯<第四版>笔记8之__模板匹配

本文探讨了语音识别中度量的不同方法,包括基于最优路径搜索的度量、基于相关性的度量、可变形模板模型及基于内容的信息检索。重点介绍了编辑距离、动态时间扭曲等关键技术,以及它们在语音识别、模式查找等领域的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  对语音识别来讲,同一个单词被同一个人每次说的情况都不同,给识别带来困难。本章讨论的就是对不同的情形如何定义适应不同特性的度量。


1,基于最优路径搜索的度量:①贝尔曼最优性原则和动态编程②编辑距离(The Edit Distance)③在语音识别动态时间扭曲(DTW), speaker-dependentrecognition. speaker-independentrecognition.


2,基于相关性的度量:这一部分解决的问题是“给定一组记录数据,查找数据是否包含已知模式,并找出其具体位置”。许多应用都涉及这一问题:目标检测、机器人视觉和视频编码。


3,可变形模板模型:这部分的目标就是寻求模板匹配来解释图像中参考模板和测试模板之间的差异。


4,基于内容的信息检索:相关性反馈。传统的信息检索是基于文本的,本部分讨论基于内容的,比如,图像检索中,通过图像的纹理,颜色,形状描述检索。



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值