通用模型与专用求解器:评估大语言模型在高度约束的生物物理序列优化任务中的表现
尽管大语言模型(LLMs)在生物分子优化问题中展现出潜力,但它们计算成本高昂且难以满足精确约束。另一方面,专用求解器(如LaMBO-2)虽能提供高效性和细粒度控制,但需要更多领域专业知识。由于实验室验证成本高昂且合成基准不足,比较这些方法具有挑战性。
为此,我们引入了Ehrlich函数——一个能够捕捉生物物理序列优化问题几何结构的合成测试套件。实验发现,仅通过提示,现成的大语言模型难以优化Ehrlich函数。
作为回应,我们提出了LLOME(基于边际期望的语言模型优化),这是一种用于在线黑盒优化的双层优化例程。结合新颖的偏好学习损失函数,LLOME不仅能够学习解决部分Ehrlich函数,甚至在中等难度的Ehrlich变体上表现与LaMBO-2相当或更优。
然而,大语言模型也表现出一定的似然-奖励失准,且在缺乏显式奖励时表现不佳。结果表明,大语言模型偶尔能带来显著优势,但专用求解器仍具竞争力且开销更低。
注释:本文取代了arXiv:2407.00236v1,且与arXiv:2407.00236存在文本重叠。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
公众号二维码

665

被折叠的 条评论
为什么被折叠?



