
论文
文章平均质量分 93
Maples丶丶
Be quiet, be curious and be stronger.
展开
-
《An Image is Worth 16x16 Words》完整版翻译
Abstract 虽然Transformer结构已经成为NLP领域的标准,但在计算机视觉领域的应用还非常有限。在视觉领域,注意力要么是结合卷积网络来使用,要么是用于替换卷积网络的某些组件,同时保持整体结构不变。我们将证明,在图像分类任务上,对于CNN的依赖不是必要的,直接将Transformer应用到图像块序列上也可以有非常好的性能。当ViT在大型数据集上进行预训练,并迁移到中小型图像识别数据集(ImageNet、CIFAR-100,VTAB等)上时,性能大幅超过现SOTA的卷积网络,并且可以大幅降低训原创 2021-10-14 01:00:03 · 10659 阅读 · 6 评论 -
Large scale GAN training for high fidelity natural image synthesis
这篇论文是Heriot-Watt大学和Google DeepMind向ICLR 2019提交的一篇论文,最近的讨论热度非常高,公众号各种推送,这里博主也来细读学习一下。同门粗看了一下,据说文中有很多晦涩的地方,还是老老实实先翻译一遍吧=-=。原文链接:https://arxiv.org/abs/1809.11096?context=cs.LG摘要 尽管最近在生成图像建模方面取得了...原创 2018-12-11 17:23:29 · 1264 阅读 · 0 评论 -
Characterizing and Improving Stability in Neural Style Transfer
这篇论文是斯坦福大学发表在CVPR 2017上的论文,主要内容是如何保持视频的风格化的稳定性。原文链接:https://arxiv.org/abs/1705.02092摘要 最近图像风格转换的研究主要关注合成图像质量和算法速度的提升。但是实时的方法非常不稳定,应用到视频时会有明显的闪烁。本文中,我们通过检验风格迁移目标方程的解集来对这些方法的不稳定性进行了描述。结果表明,Gram...原创 2018-12-20 14:13:39 · 935 阅读 · 0 评论 -
Colorful Image Colorization
这篇论文是加里福利亚大学Richard Zhang发表在ECCV 2016上的文章,论文的工作是灰度图的自动着色,这里博主想要重点关注一下论文对颜色分布预测的工作,所以把一篇这么老的论文翻出来重新看。论文主页:http://richzhang.github.io/colorization/,东西比较全,论文,github,在线demo都有1. 论文贡献 用论文作者自己的话说,论文...原创 2018-11-09 10:55:05 · 12688 阅读 · 3 评论 -
Deep Context-Aware Descreening and Rescreening of Halftone Images
这篇论文是Intel公司在SIGGRAPH 2018发表的论文,主要讲的是用深度学习来进行半色调(Halftoning)和逆半色调(Inverse Halfoning)。 原文链接:https://dl.acm.org/citation.cfm?id=32013771. 论文贡献 直接借用论文中作者的话:提出了一种基于深度学习的Descreening(去网)方法。...原创 2018-09-17 19:03:40 · 1195 阅读 · 2 评论 -
Video Colorization 文献综述(不定期更新)
1. 2012 《A learning-based approach for automatic image and video colorizaiton》 关键词:自动图像着色,视频着色,随机森林,图像空间投票 论文方法的框架如上图所示,大致可以分为4个步骤: (1)超像素提取 (2)特征提取 (3)特征学习 (4)颜色笔画精炼和传播(1)超像素提...原创 2018-05-22 15:50:16 · 1189 阅读 · 0 评论 -
Color Image Quality Index Based on the UIQI
Color Image Quality Index Based on the UIQI BovikBovikBovik和WangWangWang于2002年提出了UIQI(Universal Image Quality Index)指标,但是UIQI只考虑了图像亮度成分的畸变,不适用于彩色图。本文在UIQI的基础上,结合互相关度量,提出了CIQI(Color Image Qualit Ind...原创 2018-05-05 16:03:48 · 2963 阅读 · 0 评论 -
Spherical CNNs 翻译(未完成)
Spherical CNNs 这篇文章是ICLR 2018上的Best Paper,由阿姆斯特丹大学发表。 原文链接:https://arxiv.org/abs/1801.10130 参考:阿姆斯特丹大学论文提出球面CNN:可用于3D模型识别摘要 卷积神经网络(CNNs)已经成为二维平面图像学习问题的首选方法。然后,近期研究中出现的大量问题需要面向球面图像的分析模型...原创 2018-04-25 17:16:26 · 2555 阅读 · 1 评论 -
Color-Mood Transformation
Color-Mood Transformation 参考文献:Data-Driven Image Color Theme EnhancementColor-Mood 颜色空间由activity,weight和heat三个坐标轴组成。CIELAB空间可以通过经验公式转为Color-Mood空间。 对于Lab空间的一点c⃗ =(L∗,a∗,b∗)c→=(L∗,a∗,b∗)...原创 2018-04-22 15:38:18 · 443 阅读 · 0 评论 -
全文翻译&杂记《Image-to-Image Translation with Conditional Adversarial NetWorks》
Image-to-Image Translation with Conditional Adversarial NetWorks 这是加里福利亚大学在CVPR 2017上发表的一篇论文,讲的是如何用条件生成对抗网络实现图像到图像的转换任务。 > 原文链接:https://arxiv.org/abs/1611.07004 > 论文主页:https://phillipi....原创 2018-04-17 14:01:46 · 45380 阅读 · 16 评论 -
写在前面的一些话
2018.4.15 最近由于找实习屡屡失败有些焦虑,想想自己从2017年5月分入门深度学习,到现在怎么也该算是个“小专家”了。实际面试过之后才发现,自己只是停留在很浅的层面上,因为自己一点点小成就沾沾自喜,不思进取。就单拿论文来说,这一年看过的论文怎么也得有上百篇了,但是现在如果想要就某个问题回想解决办法,之前看过的论文却怎么也回想不起来。看过的论文当时确实理解了,但是仅仅是理解了作者怎么做...原创 2018-04-15 15:45:59 · 482 阅读 · 3 评论