这篇文档详细描述了VoiceXML,即语音扩展标记语言。第一章介绍它的背景、基本概念和用途;第二章介绍form的对话框结构(dialog constructs)、menu、link和它们的解释机制FIA(Form Interpretation Algorithm);第三章介绍用户的DTMF(Dual Tone Multi-Frequency)和语音输入用到的语法;第四章介绍系统输出用到的语音合成和预先录制的音频;第五章介绍对话框(Dialog)流程的控制,包括变量、事件和可执行元素;第六章介绍各种环境特性,例如参数(Parameter)、属性(Property)和资源处理;附录提供了包括VoiceXML计划、FIA(Form Interpretation Algorithm)、音频文件格式等附加信息。
VoiceXML最早出现于1995年,作为一种基于XML对话的设计语言,它的出现是为了简化AT&T一个名为PML(Phone Markup Language)项目中语音识别程序的开发过程。经过AT&T的重新组织,AT&T,Lucent and Motorola的开发团队继续致力于开发他们的类PML语言。
1998年,W3C主办了一次关于语音浏览器的会议。此时,AT&T and Lucent对于最开始的PML都有各自不同的发展,Motorola开发了VoXML,IBM正在开发它自己的SpeechML。此次会议的其他与会者也正在开发类似的语言,例如HP的TalkML和PipeBeach的VoiceHTML。