29、语音业务的发展与生态解析

最新推荐文章于 2025-11-24 20:15:00 发布

blue

最新推荐文章于 2025-11-24 20:15:00 发布

阅读量26

点赞数

CC 4.0 BY-SA版权

分类专栏：机器如何理解人类语音文章标签： VoiceXML 语音识别文本转语音

本文链接：https://blog.youkuaiyun.com/blue/article/details/152115038

机器如何理解人类语音专栏收录该内容

37 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

语音业务的发展与生态解析

1. VoiceXML 基础与表单应用

VoiceXML 并非是使用语音浏览器以语音方式浏览传统 Web 的途径，而是借助传统 Web 基础设施构建语音识别应用的方法。在视觉 Web 和语音 Web 中，“表单”是常见元素，许多网页利用表单收集用户信息，如姓名、地址或账号等。

HTML 对网页浏览器显示表单有特定格式要求，涵盖字段数量、每个字段的标题、大小、位置以及可接受的输入类型（如自由文本或下拉文本框中的预定义选项）。通常，用户与表单交互时，需为每个字段填写所需信息，若表单允许，部分字段可留空。点击“提交”按钮后，网页浏览器会向特定 Web 服务器发送 HTTP 消息，同时附上在各字段中输入的文本或所选选项。Web 服务器会根据用户发送的信息，回送包含文本、图片、声音或其他待填写表单的 HTML 文档。有时，HTML 表单描述会指示浏览器仅在满足特定要求时才发送表单，例如必填字段不能为空，或填写的信息需符合预期（如邮政编码字段只能填数字）。如今，HTML 表单描述甚至能指示浏览器在将信息发送到服务器之前立即验证其有效性。

在非视觉、仅语音的界面中，表单需通过语音呈现。字段标签和用户输入都要以语音形式表达，原本在视觉表单中以视觉方式传达的信息需通过语音提示说出，而用户通常在键盘上输入的内容则由语音识别器收集。例如，图 9.7 中的视觉表单可能会变成如下音频表单：

Computer :  Say the name of the city.
You :  Portland.
Computer :  Say the state.
You :  Maine.
Compute

会员秒杀 ¥9.9 重磅福利

超级会员免费看