该文章提出用大型语言模型(LLMs)解决天文瞬变源分类问题,在保证高精度的同时提升结果可解释性,为下一代天文观测数据处理提供新方案。
一、文章主要内容总结
- 研究背景:现代天文巡天产生海量瞬变源数据,需区分真实天体信号(如超新星)与虚假成像伪影,但传统卷积神经网络(CNNs)虽分类精度高(超98%),其潜在表示不透明,可解释性差。
- 核心实验:使用谷歌LLM模型Gemini,在Pan-STARRS、MeerLICHT、ATLAS三个光学瞬变巡天数据集上测试,仅提供每个望远镜15个带注释的“目标图-参考图-差值图”样本及简洁指令,平均分类准确率达93%。
- 关键功能:Gemini不仅输出二元分类结果,还能生成自然语言描述,包括瞬变源形态、亮度变化及可能的天体物理属性,并给出观测优先级评分(高/低/无兴趣),辅助天文学家优先跟进重要事件。
- 性能验证:通过12位专业天文学家评估,Gemini生成的解释平均一致性得分超4(满分5),且模型可自我评估解释的连贯性,低连贯性得分与错误分类强相关,基于此迭代优化后,MeerLICHT数据集准确率从93.4%提升至96.7%。
- 挑战与展望:LLM当前存在计算成本高、推理速度慢(单查询需数秒,远慢于CNNs的毫秒级)的问题,未来可通过优化小型开源模型、量化技术或“CNNs初筛+LLM细解”的混合方案解决;同时可扩展至星系分类、系外行星凌日识别等领域,并整合光谱和时间序列数据实现多模态分析。
订阅专栏 解锁全文
529

被折叠的 条评论
为什么被折叠?



