移动设备上的用户自适应视频检索
1. 引言
如今,手机和个人数字助理(PDA)等手持移动设备越来越普及且功能强大,为获取无处不在的多媒体信息创造了新的可能性。新一代移动设备不仅用于语音通信,还常被用于捕捉、处理和显示各种视听媒体内容。随着GSM、卫星、无线局域网(WLAN)和3G等无线网络技术的迅速发展,将大型多媒体项目传输到移动客户端变得更加容易。
然而,多媒体移动服务不仅受到小显示屏尺寸的限制,还受到电源、存储空间、处理速度等方面的限制。手持设备上多媒体内容的导航总是在有限的时间内进行,且交互量最小。同时,由于内存有限,视频等大型多媒体数据无法永久存储在移动设备上。
以基于移动的多媒体应用中的典型场景为例,体育迷希望通过手机观看体育视频。然而,观看整场比赛既昂贵又有时不必要,因为这会花费很长时间、占用大量内存并耗尽电源。因此,更好的解决方案是为他们提供浏览和检索仅包含有趣事件镜头或时间事件序列的短视频剪辑的能力。要完成这项任务,存在诸多挑战:
- 难以正确分割视频并自动注释语义事件。尽管先进技术能从各种视频中提取多模态视觉和音频特征,但在将这些低级或中级特征与高级丰富语义联系起来时,“语义鸿沟”仍然是一个关键问题。
- 必须解决数据库建模问题,特别是考虑多媒体对象之间的时间和/或空间关系时,它应支持基本检索方法和复杂的时间事件模式查询。
- 需要支持多媒体应用中的个人用户偏好,人们对媒体数据有不同的兴趣和感知,因此应结合用户反馈来训练检索系统。
- 应减少用户交互次数,以减轻用户负担并适应移动设备的限制,跟踪用户操作并积累用户偏好知识。
- 系统架构应减少要传输的数据大小,并最小化移动设备的数据存储要求。
- 基于移
超级会员免费看
订阅专栏 解锁全文
8万+

被折叠的 条评论
为什么被折叠?



