语音理解技术:挑战与解决方案
1. 上下文与ATIS挑战
在交流中,我们之前说过的信息构成了“上下文”。虽然有很多关于人类如何使用和维持对话上下文的语言理论,但构建一个能像人类一样运用上下文的机器,是自动航班信息系统(ATIS)面临的一大挑战。
ATIS机器在识别和理解自然语言时,需要考虑整个对话的上下文。而最终的挑战是将这些理解准确地转化为SQL语句,从数据库中提取所需信息。这个问题的精确界定非常复杂,需要一个专家委员会在项目的整个周期内共同协作来解决。
2. 寻找合适的评估指标
TI - DIGITS和资源管理项目表明,拥有一个通用的评估语料库对实现准确的单词识别很有优势,这对ATIS也同样适用。但单词准确率并非衡量ATIS性能的唯一指标,理解用户的每个请求并给出正确答案才是ATIS的最终目标。
从原理上讲,ATIS机器可分为两个不同的模块:语音识别模块和自然语言理解模块,其结构如下:
graph LR
classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px;
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
A([语音]):::startend --> B(语音识别器):::process
B --> C(语音转录文本):::process
D(上下文):::process --> E(自然语言理解模块):::process
C -->
超级会员免费看
订阅专栏 解锁全文
2421

被折叠的 条评论
为什么被折叠?



