文章主要内容和创新点
主要内容
本文聚焦于可视化重定向(Visualization Retargeting)——即把现有图表适配到新数据集的过程,探讨了大型语言模型(LLMs)在这一过程中的辅助作用及其局限性。
研究背景指出,传统可视化重定向依赖人工修改,需设计者同时熟悉示例图表的实现逻辑和新数据集的转换需求,效率低下。而LLMs的发展为自动代码适配提供了可能。
研究方法上,作者评估了两种LLM辅助策略:
- 基线方法:直接指令LLM生成并适配代码(将代码视为文本输入);
- 程序合成管道:LLM基于示例代码和数据的属性提供结构信息(如视觉编码),指导代码构建。
通过对4个数据集和8个不同复杂度的Python图表(共生成64个重定向可视化结果)的测试,发现两种方法在新数据未适当转换时均表现不佳,并按类型和严重程度对错误进行了分类(如语法错误、语义错误、语用错误)。最终,作者提出了未来重定向系统的设计建议,包括混合主动辅助、突出数据依赖、整合转换支持等。
创新点
- 明确界定可视化重定向概念:区别于以往基于图像(如SVG、位图)的重样式方法,聚焦于图表的代码规范(如Vega-Lite、Matplotlib代码),利用规范中包含的复杂数据转换等上下文信息,提升重定向的准确性。
- 系统评估LLM辅助效果:首次在多