论文:Medical Visual Question Answering: A Survey
作者:Zhihong Lin,Donghao Zhang,Qingyi Tac,Danli Shi,Gholamreza Haffari,Qi Wu,Mingguang He,Zongyuan Ge
机构:beResearch Center, Monash University, Clayton, VIC, Australia, NVIDIA AI Technology Center, Singapore, State Key Laboratory of Ophthalmology, Zhongshan Ophthalmic Center, Sun Yat-Sen University, Guangzhou, China
摘要:医学视觉问答(VQA)是医学人工智能和流行的VQA挑战的结合。给定一幅医学图像和一个自然语言的临床相关问题,医学VQA系统预计将预测一个可信和令人信服的答案。虽然已经对一般领域的VQA进行了广泛的研究,但医学VQA由于其任务的特点,仍然需要具体的调查和探索。在本次调查的第一部分中,我们涵盖并讨论了最新公开的医疗VQA数据集,包括数据源、数据量和任务特征。在第二部分中,我们回顾了医学VQA任务中使用的方法。在最后一部分,我们分析了该领域面临的一些医学挑战,并讨论了未来的研究方向。
数据集概述:

方法概览:

编码器使用情况:

我们对今年发布的计算机视觉领域的技术综述都进行了汇总和分类盘点,并持续更新在我们的Github。

另外推荐大家关注极市平台公众号,每天都会更新最新的计算机视觉论文解读、综述盘点、调参攻略、面试经验等干货~

这篇论文探讨了医学视觉问答(VQA)领域,它是医学人工智能和视觉问答挑战的交叉点。作者分析了现有的医疗VQA数据集,包括数据源、规模和特性,并回顾了相关方法。此外,他们还指出了该领域的挑战并提出了未来研究方向。
1497

被折叠的 条评论
为什么被折叠?



