大型语言模型 (LLM) 是有用的助手 – 它们擅长组合概念,并且可以阅读、编写和编码来帮助人们解决问题。但他们能发现全新的知识吗?由于法学硕士已被证明会“幻觉”事实上不正确的信息,因此利用它们来做出可验证的正确发现是一个挑战。

FunSearch,一种搜索数学和计算机科学新解决方案的方法。 FunSearch 的工作原理是将预先训练的法学硕士(其目标是以计算机代码的形式提供创造性解决方案)与自动“评估器”配对,以防止幻觉和错误想法。通过在这两个组件之间来回迭代,最初的解决方案“演变成”新的知识。系统搜索用计算机代码编写的“函数”;因此得名 FunSearch。

科学进步始终依赖于分享新理解的能力。 FunSearch 之所以成为一个特别强大的科学工具,是因为它输出的程序揭示了其解决方案是如何构建的,而不仅仅是解决方案是什么。
FunSearch 是一个迭代过程;在每次迭代中,系统都会从当前的程序池中选择一些程序,并将其馈送到法学硕士。法学硕士创造性地在此基础上构建,并生成新的程序,并自动评估。最好的程序将被添加回现有程序库中,从而创建一个自我改进的

大型语言模型FunSearch通过结合预训练法学硕士和自动评估器,生成创新的计算机代码解决方案,已实现数学科学中的重大突破,尤其是在组合问题上。其输出的可验证程序推动了科学进步,并展示了在通信理论等领域潜在的应用前景。
最低0.47元/天 解锁文章
2607

被折叠的 条评论
为什么被折叠?



