
计算机视觉
AI记忆
这个作者很懒,什么都没留下…
展开
-
《Color Transfer Based on Normalized Cumulative Hue Histograms》论文实现
论文《Color Transfer Based on Normalized Cumulative Hue Histograms》(在代码中对应类HistogramCT.h)的算法流程是:1.首先调用InitData();初始化数据。2.调用hist_rH = HistogramModeling();得到直方图比对后生成的H维(色调)值。3.调用cvMerge(hist_rH,原创 2011-12-06 17:03:49 · 2138 阅读 · 0 评论 -
[caffe]深度学习之MSRA图像分类模型Deep Residual Network(深度残差网络)解读
MSRA的深度残差网络在2015年ImageNet和COCO如下共5个领域取得第一名:ImageNet recognition, ImageNet detection, ImageNet localization, COCO detection, and COCO segmentation。文章:Deep Residual Learning for Image Recognition; 代码:https://github.com/KaimingHe/deep-residual-networks原创 2016-03-16 17:55:22 · 44333 阅读 · 4 评论 -
[caffe]深度学习之图像分类模型Batch Normalization[BN-inception]解读
一、简介如果将googlenet称之为google家的inception v1的话,其Batch Normalization(http://arxiv.org/pdf/1502.03167v3.pdf)文章讲的就是BN-inception v1。它不是网络本身本质上的内容修改,而是为了将conv层的输出做normalization以使得下一层的更新能够更快,更准确。二、原创 2016-03-05 10:05:47 · 29501 阅读 · 7 评论 -
[caffe]深度学习之图像分类模型googlenet[inception v1]解读
googlenet和vgg是2014年imagenet竞赛的双雄,这两类模型结构有一个共同特点是go deeper。跟vgg不同的是,googlenet做了更大胆的网络上的尝试而不是像vgg继承了lenet以及alexnet的一些框架,该模型虽然有22层,但大小却比alexnet和vgg都小很多,差不多20m的样子。原创 2016-03-05 10:00:37 · 24430 阅读 · 15 评论 -
深度学习之google deepmind的alphago AI人工智能算法技术演变历程
最近大家比较关心的围棋人机大战(google alphago深度学习+蒙特卡洛搜索算法 vs 李世石)中,google deepmind基于Nature2016文章的alphago算法在5局制的比赛中已经取得了3-1的成绩提前锁定了胜局。本文扒了一下google deepmind在该领域的一些文章,揭示了google alphago的算法技术演变历程。原创 2016-03-14 22:15:56 · 14027 阅读 · 2 评论 -
Deep Learning Papers
一、Image Classification(Recognition)lenet: http://yann.lecun.com/exdb/publis/pdf/lecun-01a.pdfalexnet: http://www.cs.toronto.edu/~fritz/absps/imagenet.pdfoverfeat: http://arxiv.org/pdf/1312.6229v原创 2015-06-04 17:33:23 · 2023 阅读 · 2 评论 -
视觉中常见坐标系
最近在做2D转3D的东西,结果发现坐标系每次都要花些时间去确定下,故在此总结下。1.OpenGL坐标系:默认的OpenGL视点都是指向Z轴负方向。2.相机局部坐标系:因为常用的相机局部坐标系和OpenGL的坐标系是不同的,故用OpenGL显示的时候,要特别注意这点。3.常用的图片存储和读取坐标系,以及MFC窗口的坐标系:4.C原创 2012-04-18 14:25:47 · 3507 阅读 · 0 评论 -
《Color Transfer Between Images》论文实现
论文《Color Transfer Between Images》的算法流程是: 1.首先InitData();由输入图片和参考图片得到输入图片的rgb向量数组image_sV,同理得到参考图片的rgb向量数组image_tV。2.调用TransferRGB2LAB(image_sV, height_s,width_s );函数根据论文将输入图片从rgb空间转化到LAB空间,同理将参考原创 2011-12-06 17:58:30 · 8646 阅读 · 11 评论 -
深度学习之图像分类模型inception v2、inception v3解读
inception v2与inception v3两种模型配置。Inception v3单模型达到了21.2%的top1错误率,多模型达到了17.3%的top1错误率原创 2016-03-05 10:30:21 · 71586 阅读 · 1 评论