多模态话语树在健康管理与安全领域的应用
1. 引言
在信息处理中,话语分析对于构建文本中思想的逻辑结构起着至关重要的作用。话语树(DTs)作为一种工具,能够以层次化的方式将文本话语形式化,明确短语和句子之间的修辞关系。它是一种介于完整逻辑表示(如逻辑形式)和非结构化原始文本表示之间的高级表示方式。DTs在内容生成、文本摘要、机器翻译和问答系统等领域有着广泛的应用。
然而,DTs在一般数据分析任务中的应用存在局限性,它主要用于表示文本的话语结构,而难以体现抽象数据项各组件之间的因果关系。为解决这一问题,我们提出将DTs推广到任意数据类型,并将其应用于健康管理和安全领域。
在以往的工作中,我们将DTs提升到更高的抽象层次,旨在形成一个用于交互式知识发现的统一结构。为了为用户提供系统的内容探索导航方式,我们基于文本的DTs,将话语分析扩展到文档语料库级别。我们认为,知识探索应通过导航为整个相关内容语料库构建的DT来驱动,这种树被称为扩展话语树(EDT)。它是先跨文档内段落,再跨语料库中文档的各个段落DT的组合。
在本文中,我们将研究范围从医学领域拓展到法医分析和健康管理,展示具有更高抽象性和通用性的话语表示的应用领域。我们探索其在疾病传播管理和犯罪调查等领域的应用,这些领域拥有丰富多样的数据来源。
我们将文本话语表示中的DT概念扩展到各种形式和性质的数据。在定义了包含言语行为理论的交际DT(CDTs)、将DT扩展到多文档级别以及实体DT以跟踪话语如何涵盖各种实体之后,我们进一步提升话语抽象层次,不仅对文本和文本文档的话语进行形式化,还对各种相关数据的话语进行形式化。这是因为文本片段之间的修辞关系,如原因、因果、促成、对比和时间顺序等,同样适用于数
超级会员免费看
订阅专栏 解锁全文
39

被折叠的 条评论
为什么被折叠?



