
文章主要内容总结
本文介绍了字节跳动开发的两个形式化推理系统——Seed-Prover和Seed-Geometry,旨在提升自动定理证明能力,尤其是解决IMO(国际数学奥林匹克)级别的竞赛问题。
-
Seed-Prover:基于Lean形式化语言的全证明推理模型,采用“引理式证明”范式,通过迭代优化(结合Lean反馈、已证明引理和自我总结)提升证明能力。设计了轻、中、重三层次测试时推理策略,实现深度与广度推理结合,在过往IMO问题(78.1%证明率)、MiniF2F(饱和)、PutnamBench(超50%)等基准测试中大幅超越现有最佳模型,并在2025年IMO中证明了6题中的5题。
-
Seed-Geometry:针对Lean几何支持不足的问题设计的专用几何推理引擎,基于前向链推理,通过扩展领域特定语言、优化推理引擎速度(C++实现提速100倍)、训练专用大语言模型及广泛搜索,在IMO几何问题(2000-2024年IMO-AG-50中解决43题,超过AlphaGeometry 2)和2025年IMO几何题(2秒内解决)中表现优异。
创新点
-
Seed-Prover的创新
订阅专栏 解锁全文
820

被折叠的 条评论
为什么被折叠?



