多模态趋势信息汇总与交互式虚拟毛笔系统研究
多模态趋势信息汇总研究
多模态汇总技术旨在通过协调文本摘要和信息可视化来应对当前海量的可用信息。趋势信息非常重要,因为它能以多种模式汇总大量的语言和非语言信息,所以多模态趋势信息汇总值得深入研究。
MuST数据集的设计推动了多模态汇总的发展。尽管多模态汇总需要多个研究领域广泛应用的组件技术,构建一个完整系统较为困难,但使用该数据集使参与者能够专注于自己的研究主题,即整个框架的部分内容。参与者可以以数据集为共同基础相互交流兴趣,并了解自己的研究或模块如何融入框架,这对研究基础技术的人尤为重要。
MuST项目于2004年11月宣布启动。2005年初,创建了感兴趣人员的邮件列表并开始招募参与者,同时向参与者提供数据集。在第一个周期,MuST有15名参与者。2006年3月举行了封闭研讨会作为第一周期的结束,所有参与者都展示了他们的研究进展并进行了深入讨论。目前,MuST有18名参与者,正处于第二个周期,该周期将于2007年3月的研讨会结束。这个周期和第一个周期一样,欢迎所有使用MuST数据集的研究,以促进积极的讨论和研究,包括系统开发、基础技术研究和数据分析。此外,还开始了资源积累,参与者可以共享第一周期生成的数据和工具。
在研讨会中,当前的主要工作包括:
- 信息提取以可视化趋势信息 :为了在图表上绘制更多的数据点,一些参与者不仅利用直接表达(如“每桶价格涨到20.20美元”),还利用比较表达(如“截至今年2月,油价自去年10月以来已下跌40%”)。另一个小组强调将一段时间内的数据变化而非数据点作为信息提取和表示的单位,他们提出了一种广泛适用的信息提取方法,将时间序列信息的变