为移动应用加上多模式的界面,能够丰富用户体验,通过语音进行输入,然后进行翻译,这样使得用户更容易地与机器进行沟通。 这篇文章介绍了运行于手机或者个人数字助理(PDA)上的自动多模式翻译系统,该系统使用了 IBM WebSphere Translation Server。
随着手持设备,车载电子设备的普及,越来越多的面向这些设备的Web应用系统也应运而生。但是在小屏幕设备上使用按键、手写笔等传统的输入方式使得填写表单变得不是那么容易。多模式(Multimodal)通过引入语音识别和语音合成技术,很好地解决了这个问题。
Multimodal 的核心就是把语音技术纳入到应用系统的输入输出方式中,遵循 W3C 制定的 X+V (XHTML+VoiceXML)标准,在 Multimodal 浏览器中访问 X+V 的Web应用,用户就可以使用语音结合按键、手写笔等方式方便地使用这些应用。比如一个餐馆的网上订餐系统,传统的方式需要用户在页面上进行选择,甚至拼音输入或者手写识别输入,使用 Multimodal 技术,用户访问订餐系统的页面以后就可以说出要点的菜名,系统进行识别并且自动填写表单,进行提交。这样就解放了双手,使得在小设备上使用 Web 应用程序变得十分简单。
Multimodal 应用使用 X+V,实现了基于 VoiceXML 的语音应用程序和基于XHTML的可视化应用程序的自然融合。对于具有Web应用开发经验的开发者来说,开发多模式应用系统并不是一件困难的事情。多模式应用的构架类似于普通网页系统的构架,浏览器向服务器提交请求,服务器返回页面,如 图 1所示。
。。。。。。
多模式掌上翻译系统
最新推荐文章于 2025-07-25 17:06:10 发布