
深度学习
文章平均质量分 94
spearhead_cai
努力成为既能撸算法又能写好代码的算法工程师!学习的方向包括python,机器学习、深度学习和计算机视觉算法。
展开
-
BokehMe: When Neural Rendering Meets Classical Rendering
本文提出了 BokehMe,这是一个混合的虚化渲染框架,将神经渲染器与经典的物理驱动渲染器结合在一起。给定单个图像和可能不完美的视差图,BokehMe 可以生成具有可调节的模糊大小、焦平面和光圈形状的高分辨率照片般逼真的虚化效果。为此,本文分析了经典的基于散射的方法的误差,并推导出计算误差图的公式。基于这个公式,通过基于散射的方法实现了经典渲染器,并提出了一种两阶段神经渲染器来修复经典渲染器中的错误区域。神经渲染器采用动态多尺度方案来有效处理任意模糊大小,并经过训练以处理不完美的视差输入。原创 2022-10-01 16:28:53 · 1528 阅读 · 1 评论 -
[论文笔记]Depth-Aware Multi-Grid Deep Homography Estimation with Contextual Correlation
如何解决单应性估计在低纹理和低重叠率场景效果不理想的问题?本文提出一种基于上下文相关性的多网格单应性估计方法来解决这两种问题原创 2022-05-03 22:39:36 · 2609 阅读 · 0 评论 -
【论文精读】Deep Rectangling for Image Stitching: A Learning Baseline
目前图像拼接后会产生不规则的边界,常用的较好解决方法是图像矩形化,本文是基于图像矩形做的修改,速度更快,效果更好原创 2022-04-23 19:59:48 · 4243 阅读 · 2 评论 -
神经网络中的 Dropout 以及变体方法
点击上方蓝字,关注并星标,一起学习算法编程这是我的第 17 篇笔记,总共 6000 字,阅读大约需要 15 分钟Dropout 的学习笔记,主要参考文章:12种主要的Dropout方法:如何应用于DNNs,CNNs,RNNs中的数学和可视化解释【科普】神经网络中的随机失活方法1. 简介深度学习训练模型的一个主要挑战是协同适应,这意味着神经元之间是相互依赖的,也就是相对于输入它们还不够独立,而且经常会有一些神经元具有更重要的预测能力,这可能导致模型会过度依赖个别的神经元的输出。但这种情况应原创 2022-03-13 16:21:30 · 4734 阅读 · 0 评论 -
A Quantization-Friendly Separable Convolution for MobileNets
这是公众号的第 15 篇原创文章,本文大约 5500 字,阅读大约需要 15 分钟论文:《A Quantization-Friendly Separable Convolution for MobileNets》论文地址:https://arxiv.org/pdf/1803.08607.pdf这篇是高通在 2018 年发表的一篇论文,主要是针对在量化方面效果很差的 MobileNetV1 网络进行研究,探索其量化掉点很严重的原因(从浮点模型的 70原创 2021-11-14 17:56:52 · 2424 阅读 · 0 评论 -
Focal Loss 论文笔记
论文:《Focal Loss for Dense Object Detection》论文地址:https://arxiv.org/abs/1708.02002代码地址:官方 github:https://github.com/facebookresearch/detectrontensorflow:https://github.com/tensorflow/modelshttps://github.com/fizyr/keras-retinanethttps://github.com/yhe.原创 2021-07-31 19:03:41 · 656 阅读 · 0 评论 -
7 个有用的 PyTorch 技巧
12.7 个有用的 PyTorch 技巧原文:https://www.reddit.com/r/MachineLearning/comments/n9fti7/d_a_few_helpful_pytorch_tips_examples_included/原文标题:a_few_helpful_pytorch_tips_examples_included译文作者:kbsc13联系方式:Github:https://github.com/ccc013/AI_algorithm_notes知乎专栏:机器转载 2021-05-16 15:55:57 · 519 阅读 · 0 评论 -
[论文笔记]弱监督条件下基于相似性条件学习的服饰搭配生成
论文:《Learning Similarity Conditions Without Explicit Supervision》论文地址:https://arxiv.org/pdf/1908.08589.pdf代码地址:https://github.com/rxtan2/Learning-Similarity-Conditions本文首发于 https://mp.weixin.qq.com/s/WHnYNvWWkPmqh1HrytCHqg联系方式:Github:https://github.c原创 2021-04-17 12:26:14 · 566 阅读 · 0 评论 -
[论文笔记]基于 CNN+双向LSTM 实现服饰搭配的生成
论文:《Learning Fashion Compatibility with Bidirectional LSTMs》论文地址:https://arxiv.org/abs/1707.05691代码地址:https://github.com/xthan/polyvore1. 简介时尚搭配推荐的需求越来越大,本文是基于两个方面的时尚推荐:给定已有的服饰,推荐一件空缺的衣服,从而形成一套搭配,即在已经有上衣、裤子的情况下推荐一双鞋子;根据多种形式的输入,比如文本或者一件衣服图片,生成一套搭配;原创 2021-03-21 19:56:20 · 1768 阅读 · 0 评论 -
目标检测学习笔记
看完吴恩达老师的 deeplearning.ai 课程目标检测这节课程的学习笔记。文章目录1. 目标定位(object localization)2. 基于滑动窗口的目标检测算法滑动窗口的卷积实现Bounding Box预测(Bounding box predictions)交并比(Intersection over union)3. 非极大值抑制4. Anchor Boxes5. 候选区域参考1. 目标定位(object localization)图像分类、目标定位以及检测的区别如下图所示,前两个是原创 2020-08-27 23:11:13 · 498 阅读 · 0 评论 -
基于Keras的多标签图像分类
原文链接:https://www.pyimagesearch.com/2018/05/07/multi-label-classification-with-keras/作者:Adrian Rosebrock今天介绍的是基于 Keras 实现多标签图像分类,主要分为四个部分:介绍采用的多标签数据集简单介绍使用的网络模型 SmallerVGGNet,一个简化版的 VGGNet实现 Smal...翻译 2019-07-22 21:13:39 · 9160 阅读 · 4 评论 -
一文了解下 GANs可以做到的事情
原文链接:https://machinelearningmastery.com/impressive-applications-of-generative-adversarial-networks/简介如果说目前深度学习最火,应用最多的领域,莫过于 GAN–Generative Adversarial Network,翻译过来就是生成对抗网络,单单从名字上看,你会觉得它就是一个生成模型,看起来...翻译 2019-06-29 21:55:14 · 5292 阅读 · 0 评论 -
必读的10篇关于GAN的论文
前言上次写的文章-- 一文了解下 GANs可以做到的事情,如果想进一步了解 GAN,学习研究 GAN,可以先从这 10 篇论文开始。本文翻译自:https://towardsdatascience.com/must-read-papers-on-gans-b665bbae3317原文介绍 10 篇介绍 GANs 以及最新进展的论文,跟原文介绍顺序有所不同,我是根据时间顺序,从最开始提出的 ...翻译 2019-07-08 22:07:28 · 18697 阅读 · 0 评论 -
[Github推荐]CVPR2019录用论文下载及可视化论文网站
简介CVPR 是 IEEE Conference on Computer Vision and Pattern Recognition 的缩写,即 IEEE 国际计算机视觉与模式识别会议。该会议是由 IEEE 举办的计算机视觉和模式识别领域的顶级会议。它是 IEEE 一年一度的学术性会议,会议的主要内容是计算机视觉与模式识别技术。CVPR是世界顶级的计算机视觉会议(三大顶会之一,另外两个是 I...原创 2019-06-16 20:29:17 · 970 阅读 · 0 评论 -
一文了解神经网络的基本原理
这是简单介绍神经网络的知识,并介绍一种特别的神经网络–多层感知器(Multi Layer Perceptron,MLP)。翻译自 https://ujjwalkarn.me/2016/08/09/quick-intro-neural-networks/这篇文章并不涉及到对数学公式的推导,只是简单介绍了神经网络的结构和基本原理。1. 神经元神经元(neuron)是神经网络的基本计算单元,也...翻译 2019-06-13 11:02:13 · 1698 阅读 · 0 评论 -
[资源]基于 Pytorch 的 TorchGAN开源了!
之前推荐过一个基于 TensorFlow 的 GAN 框架–谷歌开源的 GAN 库–TFGAN。而最近也有一个新的 GAN 框架工具,并且是基于 Pytorch 实现的,项目地址如下:https://github.com/torchgan/torchgan对于习惯使用 Pytorch 框架的同学,现在可以采用这个开源项目快速搭建一个 GAN 网络模型了!目前该开源项目有 400+ 星,它...原创 2018-12-30 19:52:00 · 886 阅读 · 0 评论 -
论文阅读(1)--Fine-grained Image Classification by Exploring Bipartite-Graph Labels
这是阅读《Fine-grained Image Classification by Exploring Bipartite-Graph Labels》这篇论文所做的笔记。这篇论文是来自NEC实验室,是一篇有关细粒度分类/精细分类方面的论文。原创 2016-07-13 19:53:44 · 5917 阅读 · 1 评论 -
论文阅读(2)--Picking Deep Filter Responses for Fine-grained Image Recognition
这次阅读的文章是Picking Deep Filter Responses for Fine-grained Image Recognition,这篇文章是来自上海交通大学Xiaopeng Zhang等人的工作,该文章提出了一种对深度网络中的filter进行挑选的方法,基于挑选的filter的结果构建复杂特征表达。原创 2016-10-08 22:56:49 · 3841 阅读 · 1 评论 -
论文阅读(4)--Part-Stacked CNN for Fine-Grained Visual Categorization
这篇文章是来自悉尼科技大学Shaoli Huang等人的工作,与前两篇文章的出发点类似,本篇文章也是在Parts上寻找Fine-Grained的线索,但与前两篇文章相比,在框架中人工的参与更少。原创 2016-10-12 15:31:01 · 5851 阅读 · 13 评论 -
(转)在Windows上安装GPU版Tensorflow
转载自在Windows上安装GPU版Tensorflow。1. 下载安装Anaconda简单说就是下载 64位 python 3.5 版本的Anacondahttps://www.continuum.io/downloads#windows安装情况:新机,未装python。注意a. Windows只支持64位 python 3.5https://www.tensorflow.org/versions转载 2017-07-01 16:31:51 · 1458 阅读 · 0 评论 -
基于CNN的增量学习论文的读后感
最近在阅读几篇基于CNN的增量学习的论文。《INCREMENTAL LEARNING WITH PRE-TRAINED CONVOLUTIONAL NEURAL NETWORKS AND BINARY ASSOCIATIVE MEMORIES》09-19 阅读第一篇论文是《INCREMENTAL LEARNING WITH PRE-TRAINED CONVOLUTIONAL NEURAL NETWO原创 2017-09-19 15:32:20 · 6018 阅读 · 3 评论 -
卷积神经网络(CNN)介绍
简单介绍和总结卷积神经网络(Convolutional Neural Networks)的基本组成网络层和常用的网络结构。参考文章/书籍:An Intuitive Explanation of Convolutional Neural Networks对CNN中pooling的理解《深度学习轻松学:核心算法与视觉实践》ResNet解析简介CNN可以应用在场景分类,图像...原创 2018-05-08 12:03:26 · 36653 阅读 · 0 评论 -
[GAN学习系列] 初识GAN
本文大约 3800 字,阅读大约需要 8 分钟要说最近几年在深度学习领域最火的莫过于生成对抗网络,即 Generative Adversarial Networks(GANs)了。它是 Ian Goodfellow 在 2014 年发表的,也是这四年来出现的各种 GAN 的变种的开山鼻祖了,下图表示这四年来有关 GAN 的论文的每个月发表数量,可以看出在 2014 年提出后到 2016 年相...原创 2018-10-24 22:20:11 · 3214 阅读 · 0 评论 -
[GAN学习系列2] GAN的起源
本文大约 5000 字,阅读大约需要 10 分钟这是 GAN 学习系列的第二篇文章,这篇文章将开始介绍 GAN 的起源之作,鼻祖,也就是 Ian Goodfellow 在 2014 年发表在 ICLR 的论文–Generative Adversarial Networks”,当然由于数学功底有限,所以会简单介绍用到的数学公式和背后的基本原理,并介绍相应的优缺点。基本原理在[GAN学习系列...原创 2018-11-03 17:50:11 · 1865 阅读 · 0 评论 -
谷歌开源的 GAN 库--TFGAN
本文大约 8000 字,阅读大约需要 12 分钟第一次翻译,限于英语水平,可能不少地方翻译不准确,请见谅!最近谷歌开源了一个基于 TensorFlow 的库–TFGAN,方便开发者快速上手 GAN 的训练,其 Github 地址如下:https://github.com/tensorflow/models/tree/master/research/gan原文网址:Generative ...翻译 2018-11-11 16:27:16 · 2686 阅读 · 0 评论 -
TensorFlow 加载多个模型的方法
采用 TensorFlow 的时候,有时候我们需要加载的不止是一个模型,那么如何加载多个模型呢?原文:https://bretahajek.com/2017/04/importing-multiple-tensorflow-models-graphs/关于 TensorFlow 可以有很多东西可以说。但这次我只介绍如何导入训练好的模型(图),因为我做不到导入第二个模型并将它和第一个模型一起...翻译 2018-11-18 18:19:23 · 10101 阅读 · 2 评论 -
必读的AI和深度学习博客
技术的提高是需要日积月累的努力,除了看书看视频外,一个很有效的提高方法当然就是阅读大牛的博客文章了,所谓听君一席话,胜读十年书,虽然读大牛的文章没有这么夸张,但也可以让你解决技术上的一些难题,可以学习大牛的学习方法和思维方式,受益匪浅!接下来会介绍一些 AI 和深度学习方面的博客。原文:Must-read Blogs for AI and Deep Learning Enthusiasts...翻译 2018-11-21 00:13:44 · 715 阅读 · 0 评论 -
[GAN学习系列3]采用深度学习和 TensorFlow 实现图片修复(中)
上一篇文章–[GAN学习系列3]采用深度学习和 TensorFlow 实现图片修复(上)中,我们先介绍了对于图像修复的背景,需要利用什么信息来对缺失的区域进行修复,以及将图像当做概率分布采样的样本来看待,通过这个思路来开始进行图像的修复。这篇文章将继续介绍原文的第二部分,利用对抗生成网络来快速生成假图片。目录如下:第二步:快速生成假的图片从未知的概率分布中学习生成新的样本[ML-Hea...翻译 2018-12-16 12:04:36 · 2443 阅读 · 0 评论 -
[GAN学习系列3]采用深度学习和 TensorFlow 实现图片修复(上)
在之前的两篇 GAN 系列文章–[GAN学习系列1]初识GAN以及[GAN学习系列2] GAN的起源中简单介绍了 GAN 的基本思想和原理,这次就介绍利用 GAN 来做一个图片修复的应用,主要采用的也是 GAN 在网络结构上的升级版–DCGAN,最初始的 GAN 采用的还是神经网络,即全连接网络,而 DCGAN 则是换成卷积神经网络(CNNs)了,这可以很好利用 CNN 强大的特征提取能力,更好的...翻译 2018-12-10 23:30:40 · 3995 阅读 · 1 评论 -
[GAN学习系列3]采用深度学习和 TensorFlow 实现图片修复(下)
这是本文的最后一部分内容了,前两部分内容的文章:[GAN学习系列3]采用深度学习和 TensorFlow 实现图片修复(上)[GAN学习系列3]采用深度学习和 TensorFlow 实现图片修复(中)以及原文的地址:http://bamos.github.io/2016/08/09/deep-completion/最后一部分的目录如下:第三步:为图像修复寻找最佳的假图片利用 ...翻译 2018-12-22 18:21:47 · 3750 阅读 · 6 评论 -
论文阅读(3)--SPDA-CNN: Unifying Semantic Part Detection and Abstraction for Fine-grained Recognition
这篇文章是来自罗格斯大学的Han Zhang等人的工作。由题目可知与上一篇文章一样,本文的作者也关注到了富有语义的局部(利用Part,Part,Part,重要事情强调三遍),作者不满足于CUB-2011数据库提供的head和body的定位结果,提出了small semantic parts 生成的方法。论文中使用的网络分为两个子网络,一个用于检测,一个用于分类。原创 2016-10-10 21:37:49 · 2400 阅读 · 2 评论