多模式掌上翻译系统

最新推荐文章于 2025-12-05 17:57:22 发布

原创最新推荐文章于 2025-12-05 17:57:22 发布 · 899 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#web应用开发 #xhtml #websphere #translation #浏览器 #服务器

本文介绍了一种利用语音识别和合成技术的多模式界面，它能显著改善移动应用的用户体验。借助IBM WebSphere Translation Server，该系统实现了语音输入与翻译功能，使用户能够在小屏设备上更轻松地进行交互。

为移动应用加上多模式的界面，能够丰富用户体验，通过语音进行输入，然后进行翻译，这样使得用户更容易地与机器进行沟通。这篇文章介绍了运行于手机或者个人数字助理（PDA）上的自动多模式翻译系统，该系统使用了 IBM WebSphere Translation Server。
随着手持设备，车载电子设备的普及，越来越多的面向这些设备的Web应用系统也应运而生。但是在小屏幕设备上使用按键、手写笔等传统的输入方式使得填写表单变得不是那么容易。多模式（Multimodal）通过引入语音识别和语音合成技术，很好地解决了这个问题。

Multimodal 的核心就是把语音技术纳入到应用系统的输入输出方式中，遵循 W3C 制定的 X+V （XHTML+VoiceXML）标准，在 Multimodal 浏览器中访问 X+V 的Web应用，用户就可以使用语音结合按键、手写笔等方式方便地使用这些应用。比如一个餐馆的网上订餐系统，传统的方式需要用户在页面上进行选择，甚至拼音输入或者手写识别输入，使用 Multimodal 技术，用户访问订餐系统的页面以后就可以说出要点的菜名，系统进行识别并且自动填写表单，进行提交。这样就解放了双手，使得在小设备上使用 Web 应用程序变得十分简单。

Multimodal 应用使用 X+V，实现了基于 VoiceXML 的语音应用程序和基于XHTML的可视化应用程序的自然融合。对于具有Web应用开发经验的开发者来说，开发多模式应用系统并不是一件困难的事情。多模式应用的构架类似于普通网页系统的构架，浏览器向服务器提交请求，服务器返回页面，如图 1所示。

。。。。。。

点击此处查看详