
计算机视觉
文章平均质量分 50
深度学习,图像处理
(DᴗD)B
不会机械的程序员不是一个好的R6玩家。
展开
-
卷积神经网络详解
人家写的是真滴好,没啥知识,只会转发了,适合初学卷积网络的童鞋https://blog.youkuaiyun.com/liangchunjiang/article/details/79030681转载 2019-03-30 10:24:32 · 222 阅读 · 0 评论 -
ctc_loss_calculator.cc:144] No valid path found.或loss: inf
最近经常出现一个错误,在模型训练的时候loss:inf,如果出现的不多的话还是可以接受的,但是一旦这个大量出现,模型就不能训练了,损失也很难收敛,所以今天我终于把这个问题解决了,写下来表示分享。产生的原因暂时还不清楚,网上能查到很多原因,但是对我这个问题并没有帮助。我出现了这个问题是因为使用了‘ctcloss’,这个时候我们找到ctc_batch_cost方法:ctrl+鼠标左键点进去,找...原创 2019-09-15 14:18:16 · 2208 阅读 · 1 评论 -
CNN+GRU+CTC实现不定长字符串识别(一)
CNN+GRU+CTC进行人民币编码识别背景背景来自于TinyMind的一个比赛,名为人民币面值及编码识别,本篇文章的前提是已经将编码定位并切割下来,图片中只有相应的编码,样子如下:当然不是这样也可以,随便什么训练集,如果没有的话可以参考我之前的文章进行生成,或者直接下载我上传的文件。地址:链接:https://pan.baidu.com/s/1KQuAdHe4nc53yeDz3jk_1...原创 2019-09-13 16:03:01 · 3568 阅读 · 0 评论 -
could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR
当我们深度学习做训练的时候,偶尔会发生这种情况,我把源错误贴出来:Epoch 1/162019-09-11 09:34:11.000335: E C:\users\nwani\_bazel_nwani\mmtm6wb6\execroot\org_tensorflow\tensorflow\stream_executor\cuda\cuda_dnn.cc:455] could not creat...原创 2019-09-11 09:42:42 · 1110 阅读 · 0 评论 -
用YOLO3进行人民币编码的定位与切割
人民币编码识别(一)编码的定位与切割背景介绍数据的预处理训练模型编码识别,坐标点的处理和保存编码切割背景介绍来自于TinyMind的一个计算机视觉的比赛,已经过去有一段时间了,不过官方开放了练习模式,用来学习还算是一个不错的选择,比赛地址https://www.tinymind.cn/competitions/47?rron=banner主要的目的就是这个:一共给了不到四万张图片,一共九...原创 2019-08-27 14:46:33 · 905 阅读 · 8 评论 -
手把手教学Yolo3的安装和实现
手把手教学Yolo3的安装和训练自己的模型Yolo的环境数据集的预处理训练模型进行识别Yolo的环境我写下我的环境win10python 3.6.4tensorflow 1.8.0tensorllow-gpu 1.8.0cudatoolkit 9.0cudnn 7.1.4最好是使用anaconda进行环境配置配置完后下载yolov3,地址 https://github.com...原创 2019-08-26 15:04:46 · 4943 阅读 · 6 评论 -
CNN(卷积神经网络)详解
CNN卷积神经网络详解Why CNN局部感受野(local receptive fields)权值共享(Shared weights and biases)池化(Pooling)总的来看原文链接:https://blog.youkuaiyun.com/m0_37490039/article/details/79378143Why CNN首先回答这样一个问题,为什么我们要学CNN,或者说CNN为什么在很多...转载 2019-08-17 11:17:29 · 35916 阅读 · 2 评论 -
python3.6.4深度学习环境配置
最近有幸把环境玩坏了,重新配置环境配置了两天才好,先写一下自己目前的环境,首先显卡驱动的版本很重要!很重要!很重要!想直接看结果的可以跳到最后。先说一下现在是2019年8月14号,如果时间过了太远可能就不管用了。我这里是GTX960,选的版本是385.69,支持的cuda是9.0,目前nvidia不能老驱动了,需要自己去找一找。CUDA对应的NVIDIA驱动版本对照表如下:之前一直尝试用...原创 2019-08-14 09:45:11 · 654 阅读 · 0 评论 -
Faster R-CNN原理
分两部分,觉得讲的很好,单纯的分享一下https://www.jianshu.com/p/71fbb3251cbfhttps://www.jianshu.com/p/adc4679b25ff转载 2019-08-19 09:06:15 · 158 阅读 · 0 评论 -
Keras进行人民币面额识别(三)
TinyMind人民币面值&冠字号编码识别挑战赛比赛链接输入信息需要输出的信息代码源码代码解释输出结果转化为相应面值打印进度输出结果本篇是对测试集进行测试和相应结果的输出比赛链接https://www.tinymind.cn/competitions/47?rron=banner输入信息也就是我们的测试集因为处理测试集的时候,我直接用的keras内置的图片生成器,所以数据需要手...原创 2019-06-15 19:37:59 · 1745 阅读 · 1 评论 -
Keras进行人民币面额识别(二)
TinyMind人民币面值&冠字号编码识别挑战赛数据准备环境的准备完整代码代码解析输出结果本篇是进行神经网络的训练数据准备上一篇文章进行了数据的分类,获得的数据如下:环境的准备进行神经网络训练,需要的环境还是比较多的,建议下载Anaconda网上有很多环境配置推荐一种,步骤比较多,不是一键式安装,中间肯定会出现各种奇奇怪怪的问题,有问题找百度https://blog.cs...原创 2019-06-14 10:49:44 · 1629 阅读 · 2 评论 -
Keras进行人民币面额识别(一)
TinyMind人民币面值&冠字号编码识别挑战赛链接地址https://www.tinymind.cn/competitions/47?rron=banner当我看到这个比赛的时候,热身赛已经结束了,不过也觉得自己不可能拿奖金,练习一下技术还是可以的。下载下来训练集后,发现是九种面值的大集合,需要将他们分类,同时给了一个csv文件,里边放着对应图片的面值,这个时候就需要整理一下了...原创 2019-06-14 10:05:11 · 3406 阅读 · 1 评论 -
深度学习中 Embedding层两大作用的个人理解
前一个月接触到一个概念,Embedding层。今天跟大家分享一下个人心得。首先,我们有一个one-hot编码的概念。假设,我们中文,一共只有10个字。。。只是假设啊,那么我们用0-9就可以表示完比如,这十个字就是“我从哪里来,要到何处去”其分别对应“0-9”,如下:我 从 哪 里 来 要 到 何 处 去0 1 2 3 4 5 6 ...转载 2019-05-18 16:16:50 · 818 阅读 · 0 评论 -
用Keras进行猫狗识别(四)
使用数据增强+特征提取+微调模型来训练模型背景数据准备背景 在上一篇文章我们引用了VGG16模型,通过删除其全连接层,再加上自己的全连接层进行训练,达到了90%的正确率。但是还有一种方法,就是微调模型,这个方法配合特征提取可以达到一个更好的高度。 什么是微调模型呢?就是通过解冻VGG16最后的几层,通过与全连接层联合训练的方式,来达到我们的目的,也就是对VGG16进行微调。 为什么只...原创 2019-05-07 23:09:55 · 1036 阅读 · 3 评论 -
用keras进行猫狗识别(三)
使用特征提取的方法对样本进行训练背景准备文件背景通过之前的数据增强+直接训练,我们将正确率提高到了八十以上,但是还有一种更好的方法去帮助我们训练,那就是使用预训练网络,原理就是前人栽树,后人乘凉,假定之前有人用了超多的数据进行训练,实现了多分类的识别,其中包括了我们本次要识别的东西,或者和我们识别的东西有相似特征的东西,这样我们就可以利用其训练的模型运用到自己的模型中。首先介绍一下卷积神经网...原创 2019-05-03 17:05:48 · 2351 阅读 · 1 评论 -
用keras进行猫狗识别(二)
通过少量的训练集,我们成功训练出了模型,但是正确率只有75%左右,而且出现了过拟合的情况,出现这种情况,我们可以采用数据增强的方法。通过数据增强,我们可以增加训练样本的数量,来解决样本不够的问题。数据增强的作用 :增加训练的数据量,提高模型的泛化能力增加噪声数据,提升模型的鲁棒性如何获得大量的数据 :一种方法是获得新的数据,这种方法比较麻烦,需要大量的成本,而第二种方法则是对数据进...原创 2019-04-27 14:38:57 · 2289 阅读 · 3 评论 -
深度学习中常见的激活函数与损失函数的选择与介绍
当我们初学深度学习时,对于激活函数和损失函数的选择并不了解,这里提出一些建议问题类型最后一层激活损失函数二分类问题sigmoidbinary_crossentropy多分类、单标签问题softmaxcategorical_crossentropy多分类、多标签问题sigmoid binary_crossentropybinary_crossentro...原创 2019-04-17 19:16:59 · 3723 阅读 · 0 评论 -
用keras进行猫狗识别(一)
Keras是一个高层神经网络API,Keras由纯Python编写而成并基Tensorflow、Theano以及CNTK后端。Keras 为支持快速实验而生,能够把你的idea迅速转换为结果,如果你有如下需求,请选择Keras:简易和快速的原型设计(keras具有高度模块化,极简,和可扩充特性)支持CNN和RNN,或二者的结合无缝CPU和GPU切换对于新手来说,keras可以说是非常的...原创 2019-04-21 17:15:51 · 1909 阅读 · 9 评论 -
CNN+GRU+CTC实现不定长字符串识别(二)
对识别结果进行投票介绍投票思路源码结果介绍一拳难敌四手,对于模型来说也是这样,单个模型的准确率终究还是不如多个模型综合起来准确率高,这里我简单的训练了四个模型,找一找他们之间的关系。我用的训练集依然是tinymind的人民币编码识别,我训练了三种模型,ResNet * 1,DenseNet * 1,Xception * 2,因为时间和硬件问题也没有训练很多,正确率分别如下:ResNet:...原创 2019-09-18 09:45:10 · 927 阅读 · 0 评论