文本数据中支持实体关系发现的可视化分析
1. 引言
在进行文本数据的内容分析时,我们通常会关注那些指代现实世界实例的重要命名对象和实体,并将它们综合成与特定信息搜索任务相关的知识。可视化分析作为一种交互式可视化方法,能够促进信息的合成与分析。
1.1 动机
可视化分析系统旨在支持实体关系发现任务,该任务涉及从文档或文档集合中识别实体和关系,以创建与任务相关的实体网络。例如,从给定文档集合中找出连接两名恐怖分子的人员和组织实体,这就需要一个交互式可视化工具来辅助完成以下操作:
- 信息的网络表示 :使用图或网络来表示实体和关系实例,便于研究和可视化它们的路径和连通性属性,同时关联包含这些实例的文档。
- 结果的交互式细化 :由于这类检索任务需要专家判断,通常会涉及多次迭代的用户交互。因此,可视化分析系统需要支持用户操作,如从检索结果中包含或排除实体和关系。
- 智能用户辅助 :考虑到文档数据量可能很大,且文档中嵌入了许多实体和关系实例,用户期望可视化分析系统提供智能辅助,帮助他们更深入地了解数据。例如,根据实体与给定恐怖分子的接近程度对实体进行排序,以辅助用户决策。
这些系统特征使可视化分析系统区别于其他用于分析实体和关系实例网络的可视化界面系统。
1.2 研究目标与贡献
本研究旨在设计一个可视化分析框架,用于实体关系发现,其假设条件为:
- 用户需要对文档内容进行判断,以识别相关的实体和关系实例。
- 发现过程是一个需要用户参与的迭代过程。
具体贡
超级会员免费看
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



