CAVE: A Visual Analytics System for Exploratory Columnar Data Augmentation Using Knowledge Graphs

最新推荐文章于 2025-10-15 16:03:02 发布

原创最新推荐文章于 2025-10-15 16:03:02 发布 · 664 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#论文

论文阅读专栏收录该内容

98 篇文章

订阅专栏

CAVA是一个创新的可视分析系统，它整合了数据管理和增强功能，允许用户在分析过程中动态添加属性。通过知识图谱，CAVA提供广泛的选择以供用户构造新的数据属性，并支持复杂的操作。系统还通过可视化界面帮助用户探索和构建查询，增强了数据探索的效率和深度。初步的用户研究表明，CAVA能够有效地帮助用户执行数据增强，改进分析结果，并证明了将数据增强融入可视化分析流程的可行性。

论文传送门

大多数可视分析系统假设所有的数据搜寻都发生在分析过程之前；一旦分析开始，考虑的数据属性集就固定了。数据构建与分析的这种分离排除了迭代，这种迭代可以根据分析过程中现场出现的需求进行搜寻。搜寻循环与数据分析任务的分离会限制分析的速度和范围。在本文中，我们介绍了CAVA，一个将数据管理和数据增强与传统的数据探索和分析任务相结合的系统，使信息能够在分析过程中就地采集。确定要添加到数据集中的属性很困难，因为它需要人工知识来确定哪些可用属性将有助于后续的分析任务。CAVA抓取知识图，为用户提供从外部数据中提取的一组广泛的属性供选择。然后，用户可以在知识图上指定复杂的操作来构造附加属性。CAVA展示了可视化分析如何通过让用户可视化地探索可用数据集以及作为查询构建的界面来帮助用户搜索属性。它还提供了知识图本身的可视化，以帮助用户理解复杂的连接，如多跳聚合。我们评估我们的系统的能力，使用户能够在两个数据集的用户研究中执行复杂的数据组合，而无需编程。然后，我们通过两个额外的使用场景来展示CAVA的通用性。评估结果证实，CAVA可有效帮助用户执行数据采集，从而改善分析结果，并为支持将数据增强集成为可视化分析管道的一部分提供证据

在这项工作中，我们提出以下贡献: