CAVE: A Visual Analytics System for Exploratory Columnar Data Augmentation Using Knowledge Graphs

CAVA是一个创新的可视分析系统,它整合了数据管理和增强功能,允许用户在分析过程中动态添加属性。通过知识图谱,CAVA提供广泛的选择以供用户构造新的数据属性,并支持复杂的操作。系统还通过可视化界面帮助用户探索和构建查询,增强了数据探索的效率和深度。初步的用户研究表明,CAVA能够有效地帮助用户执行数据增强,改进分析结果,并证明了将数据增强融入可视化分析流程的可行性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文传送门

大多数可视分析系统假设所有的数据搜寻都发生在分析过程之前;一旦分析开始,考虑的数据属性集就固定了。数据构建与分析的这种分离排除了迭代,这种迭代可以根据分析过程中现场出现的需求进行搜寻。搜寻循环与数据分析任务的分离会限制分析的速度和范围。在本文中,我们介绍了CAVA,一个将数据管理和数据增强与传统的数据探索和分析任务相结合的系统,使信息能够在分析过程中就地采集。确定要添加到数据集中的属性很困难,因为它需要人工知识来确定哪些可用属性将有助于后续的分析任务。CAVA抓取知识图,为用户提供从外部数据中提取的一组广泛的属性供选择。然后,用户可以在知识图上指定复杂的操作来构造附加属性。CAVA展示了可视化分析如何通过让用户可视化地探索可用数据集以及作为查询构建的界面来帮助用户搜索属性。它还提供了知识图本身的可视化,以帮助用户理解复杂的连接,如多跳聚合。我们评估我们的系统的能力,使用户能够在两个数据集的用户研究中执行复杂的数据组合,而无需编程。然后,我们通过两个额外的使用场景来展示CAVA的通用性。评估结果证实,CAVA可有效帮助用户执行数据采集,从而改善分析结果,并为支持将数据增强集成为可视化分析管道的一部分提供证据

在这项工作中,我们提出以下贡献:

  • 我们提出了一个可视化分析系统,CAVA,用于使用知识图谱进行探索性数据增强。我们还描述了使用可视化作为查询构建和知识图谱探索的媒介的设计过程。
  • 我们提供了CAVA应用于洞察生成和预测建模的使用场景,以展示我们方法的通用性。
  • 我们进行了一项初步的用户研究,以评估我们的系统在跨两个不同任务连接语义上有意义的外部数据方面的可用性,为我们的设计提供验证。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值