
语义分割
baidu_huihui
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
CVPR 2020 | ActBERT: 自监督多模态视频文字学习
自监督特征学习近年来已有如火如荼的发展,并从单模态的自监督学习,如图片自监督特征学习,视频自监督特征学习,蔓延到多模态,利用图片与文字或者视频与文字的关联性进行特征学习。利用图片与文字关联性进行自监督学习已有非常多优秀的工作,如 Vilbert, LXMERT, VisualBERT, VLBERT, UNITER, Unified VLP 等等。这类工作的数据源一般是 Conceptual Captions 或 SBU Captions,且图片文字对往往是从网站中已有的数据自动抓取得到,无须额...转载 2020-08-04 10:00:06 · 1032 阅读 · 0 评论 -
Paper Reading: Generating Artistic Portrait Drawings from Face Photos with Hierarchical GANs
Paper Reading NoteURL:https://cg.cs.tsinghua.edu.cn/papers/CVPR-2019-Drawing.pdfTL;DRCVPR2019一篇来自清华大学的文章,主要设计了一种GAN的结构APDrawingGAN,实现了利用GAN做人脸肖像画生成。Motivation肖像画不同于一般的轮廓,在保证人脸各部位特征的同时还需要具备一定的抽象美:从左向右为原图NPR模型NPR加上下巴轮廓引导APDrawingGAN而SOTA的GAN...原创 2020-08-02 15:02:01 · 287 阅读 · 0 评论 -
计算机视觉 - 语义分割 (semantic segmentation)
计算机视觉 - 语义分割 (semantic segmentation)人工智能被认为是第四次工业革命,google,facebook等全球顶尖、最有影响力的技术公司都将目光转向AI,虽然免不了存在泡沫,被部分媒体夸大宣传,神经网络在图像识别,语音识别,自然语言处理,无人车等方面的贡献是毋庸置疑的,随着算法的不断完善,部分垂直领域的研究已经落地应用。在计算机视觉领域,目前神经网络的应用主要有图像识别,目标定位与检测,语义分割。图像识别就是告诉你图像是什么,目标定位与检测告诉你图像中目标在哪里,语义分转载 2020-08-02 04:20:01 · 1073 阅读 · 0 评论