
论文阅读
忘泪
Github:https://github.com/wangleihitcs
Email:wangleihitcs@qq.com
展开
-
探索图像语义分割中的特征融合
简介图像语义分割是计算机视觉领域一大重要分支,在benchmark性能一次次提升的过程中,特征融合起到很重要的作用。下面,将介绍图像语义分割历年的比较不错的特征融合方法。BackboneU-Net,FPN, CVPR 2017PSPNet, CVPR 2017JPU, 2019总结特征融合方式...原创 2020-05-15 22:05:47 · 5875 阅读 · 0 评论 -
基于Box Supervision的弱监督图像语义分割
简介为什么要“弱监督”做图像语义分割让我们来看看论文怎么说的。ICCV 2015 BoxSup[1], “But pixel-level mask annotations are time-consuming, frustrating, and in the end commercially expensive to obtain.”ICCV 2015 WSSL[2], “Acquirin...原创 2019-11-07 16:16:10 · 3798 阅读 · 6 评论 -
论文阅读笔记:From Image-level to Pixel-level Labeling with Convolutional Networks
论文阅读笔记:From Image-level to Pixel-level Labeling with Convolutional NetworksIntroduceTaskWeakly supervised learning for image semantic segmentation, only use image class label.ContributionCombine...原创 2019-10-14 16:46:33 · 508 阅读 · 0 评论 -
论文阅读笔记:FULLY CONVOLUTIONAL MULTI-CLASS MULTIPLE INSTANCE LEARNING
IntroduceTaskImage Semantic Segmentation based on weakly supervised learning.ContributionsCombine MIL(Multiple Instance Learning) with end-to-end FCN(Fully Convolutional Network).Propose a multi...原创 2019-10-13 15:55:58 · 556 阅读 · 0 评论 -
ICDAR 2017 RCTW 中文场景文本检测和识别数据集
简介ICDAR是进行场景文本检测和识别(Scene Text Detection and Recognition)任务最知名和常用的数据集。ICDAR 2017 RCTW[1](Reading Chinest Text in the Wild),由Baoguang Shi等学者提出。RCTW主要是中文,共12263张图像,其中8034作为训练集,4229作为测试集。使用四边形框标注文本行。数据...原创 2019-05-02 22:43:33 · 25540 阅读 · 32 评论 -
论文阅读笔记:You Only Look Once: Unified, Real-Time Object Detection(YOLO)
Introduce目标检测,找出图像中物体的位置及类别(定位和分类)。常见的目标检测模型DPM(Deformable Parts Models):基于滑动窗口的目标检测模型R-CNN:基于Region Proposed技术的目标检测模型,精度高,速度慢YOLO:这篇论文的目标检测模型,精度达不到state of artYOLO模型的特点速度极快YOLO base mo...原创 2019-03-03 14:38:11 · 434 阅读 · 0 评论 -
论文阅读笔记:Learning Deep Features for Discriminative Localization
IntroductionTask基于弱监督学习的图像分类和定位(检测)相关工作:弱监督目标定位可视化CNNMethodClass Activation Mapping(CAM)CAM技术详细且简洁地展示了如何用CNN进行目标定位(检测)以及可视化,原理很简单,主要基于global average pooling(GAP)Firstly, get the last con...原创 2019-03-02 23:11:56 · 655 阅读 · 0 评论 -
医学诊断报告生成论文综述
摘要由Image/Video Captioning、VQA等图像理解任务的不断往前发展,以及目前智能医疗的兴起,有些学者自然而然地想到图像理解是否可以应用到医学领域,因此根据CT、核磁等图像自动生成诊断报告(病例),这个任务被提了出来。2018年是医学报告生成任务的兴起年,截止到目前,总共有4篇医学诊断报告生成的文章被发表在各个领域的顶级会议上。美国NIH吕乐(现在好像去英伟达了)课题组的王...原创 2019-01-03 02:38:01 · 13309 阅读 · 7 评论 -
Image Captioning Metrics —— CIDEr的计算
简介TF-IDF余弦相似性CIDEr算法论文链接CIDEr: Consensus-based Image Description EvaluationExamplesTF-IDF全称Term Frequency–Inverse Document Frequency,TF词频,IDF逆文本频率。博客:文本挖掘预处理之TF-IDF余弦相似性余弦相似性–维基百科CIDEr算法...原创 2018-11-18 17:15:06 · 14590 阅读 · 11 评论 -
论文阅读笔记:On the Automatic Generation of Medical Imaging Reports
一、简介这篇论文任务是根据医学图像自动生成医学诊断报告,大类属于图像生成自然语言任务。图像生成自然语言这种CV和NLP结合的任务有很多,例如Image/Video Captioning、Image/Video QA、Image/Video Paragraph Description Generation等。这篇论文是CMU那边的,中了ACL 2018,论文链接:https://arxiv.org...原创 2018-10-18 16:30:11 · 9234 阅读 · 25 评论