编辑 | 白菜叶
OpenAI o1 的突破凸显了通过增强推理能力来提高自然语言大模型(LLM)的应用潜力。然而,大多数推理研究都集中在数学任务上,而医学等领域尚未得到充分探索。
医学领域虽然不同于数学,但鉴于医疗保健的高标准,它也需要强大的推理能力来提供可靠的答案。然而,与数学不同,验证医学推理具有挑战性。
为了解决这个问题,香港中文大学,深圳市大数据研究院的研究人员提出了可验证的医学问题,使用医学验证器来检查模型输出的正确性。
同时,该团队推出了 HuatuoGPT-o1,这是一款能够进行复杂推理的医学 LLM,仅使用 40K 个可验证问题,其表现就优于医学专用基线。
该研究以「 HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs」为题,于 2024 年 12 月 25 日发布在 arXiv 预印平台。
类似 o1 的方法在医学等专业领域的应用仍未得到充分探索。医疗任务通常涉及复杂的推理。
在现实世界的医疗诊断或决策中,医生往往需要仔细斟酌。这一关乎生命的重要领域要求缜密的思考