语音技术发展与应用的多面剖析
语音技术早期发展与数据理念
在 1985 年的 DARPA 会议上,IBM 研究人员提出“没有什么数据能比更多的数据更好”的观点,当时参会者正在讨论多少数据才算足够。在 ATIS 相关工作中,部分数据收集站点定义了正式英语语法,用于改写用户的每一个表述,随后这些改写后的正式英语表述会自动转换为 SQL 语句以访问数据库。
ATIS 任务的挑战
ATIS 任务虽然仅涉及相对少量的美国机场,但像“我需要飞往旧金山”这样的句子会给评分程序带来问题,因为它需要比较非常大的结果表。在 ATIS 语料库中,类似“我需要航班信息”的简单句子甚至会导致评估程序崩溃,因为该程序无法处理结果表的巨大规模,这样的句子在合规的 ATIS 系统中会导致显示整个航班数据库,包含数以万计的记录。
语言学中的特殊句子类型
在语言学里,“你有更便宜的东西吗?”这类句子被称为“省略句”,其缺失部分需要根据上下文或惯例来推断,该句很可能意味着“你有比你刚刚给我看的更便宜的东西吗?”。而像“我明天想去那里”这样指代前一句中信息的句子则被称为“照应句”,其中“那里”指的是前一句中提到的地点,比如“我需要飞往旧金山”中的旧金山。
知识表示与技术发展
1974 年,Marvin Minsky 引入了“框架”这一术语,它是一种用于以层次结构表示任意知识的数据结构。不过要注意,不要将表示知识的数据结构“框架”与用于构建话语特征向量表示、通常为 10 毫秒的语音基本间隔“帧”相混淆。HUB 程序是用麻省理工学院语音研究小组设计和实现的特殊脚本语言编写的。
超级会员免费看
订阅专栏 解锁全文
24

被折叠的 条评论
为什么被折叠?



