【视觉语言模型+医学】23.06 LLaVA-Med(医学图片视觉助手): Training a Large Language-and-Vision Assistant for Biomedicine

LLaVA-Med是一种专为医学领域设计的语言和视觉助手,通过先进行生物医学概念对齐和后续指令微调,显著提升了医学图像理解和聊天能力。实验结果显示,两阶段训练显著优于基础版本,并接近GPT-4的性能水平。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一种基于大规模生物医学图像视觉语言助手 ,一天训练完成(8xA100)

Training a Large Language-and-Vision Assistant for Biomedicine in One Day

LLaVA家族

官方资源汇总LLaVa-med Github主页
23.04.LLaVA1.0论文: Large Language and Vision Assistant(Visual Instruction Tuning)
23.06 LLaVA-Med医学图片视觉助手): Training a Large Language-and-Vision Assistant for Biomedicine in One Day
23.10 LLaVA-1.5论文: Improved Baselines with Visual Instruction Tuning
23.11 LLaVA-Plus项目:LLaVA-Plus: Large

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

曾小蛙

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值