多模式掌上翻译系统

本文介绍了一种利用语音识别和合成技术的多模式界面,它能显著改善移动应用的用户体验。借助IBM WebSphere Translation Server,该系统实现了语音输入与翻译功能,使用户能够在小屏设备上更轻松地进行交互。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 为移动应用加上多模式的界面,能够丰富用户体验,通过语音进行输入,然后进行翻译,这样使得用户更容易地与机器进行沟通。 这篇文章介绍了运行于手机或者个人数字助理(PDA)上的自动多模式翻译系统,该系统使用了 IBM WebSphere Translation Server。
随着手持设备,车载电子设备的普及,越来越多的面向这些设备的Web应用系统也应运而生。但是在小屏幕设备上使用按键、手写笔等传统的输入方式使得填写表单变得不是那么容易。多模式(Multimodal)通过引入语音识别和语音合成技术,很好地解决了这个问题。

Multimodal 的核心就是把语音技术纳入到应用系统的输入输出方式中,遵循 W3C 制定的 X+V (XHTML+VoiceXML)标准,在 Multimodal 浏览器中访问 X+V 的Web应用,用户就可以使用语音结合按键、手写笔等方式方便地使用这些应用。比如一个餐馆的网上订餐系统,传统的方式需要用户在页面上进行选择,甚至拼音输入或者手写识别输入,使用 Multimodal 技术,用户访问订餐系统的页面以后就可以说出要点的菜名,系统进行识别并且自动填写表单,进行提交。这样就解放了双手,使得在小设备上使用 Web 应用程序变得十分简单。

Multimodal 应用使用 X+V,实现了基于 VoiceXML 的语音应用程序和基于XHTML的可视化应用程序的自然融合。对于具有Web应用开发经验的开发者来说,开发多模式应用系统并不是一件困难的事情。多模式应用的构架类似于普通网页系统的构架,浏览器向服务器提交请求,服务器返回页面,如 图 1所示。

。。。。。。

                                                                                         点击此处查看详                                                                                 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值