AAAI 2026 为什么开源 LLM 搞不定数据分析?浙江大学揭秘核心原因


论文标题:Why Do Open-Source LLMs Struggle with Data Analysis? A Systematic Empirical Study
作者团队:浙江大学
发布时间:2025年11月13日
大语言模型(LLMs)在自动化数据分析任务中具有巨大潜力,但现有开源模型在面向高强度推理场景时仍存在明显局限。为此,本工作系统研究了提升开源 LLM 数据分析能力的策略。
首先构建了一个涵盖多样且贴近真实场景的种子数据集,从数据理解、代码生成和策略规划三个核心维度对模型表现进行评测。
💕研究结果表明
(1) 策略规划能力是影响整体性能的关键因素;
(2) 交互设计与任务复杂度会影响模型的推理表现;
(3) 数据质量相较于数据多样性更能决定模型的最终效果。
基于上述洞察,我们提出了一套数据合成方法,实验证明该方法能够提升开源 LLM 在数据分析任务中的推理与决策能力。
587

被折叠的 条评论
为什么被折叠?



