
图像识别
文章平均质量分 50
szZack
写一点过往的积累。
展开
-
【AI实战】分布式训练:使用DistributedDataParallel实现单机多GPU并行训练resnet50模型
分布式训练:使用DistributedDataParallel实现单机多GPU并行训练resnet50模型原创 2023-03-02 19:29:35 · 636 阅读 · 0 评论 -
【AI实战】YOLOv7加载多GPU训练的模型报错解决方法
YOLOv7加载多GPU训练的模型报错解决方法原创 2023-01-10 11:13:34 · 1886 阅读 · 1 评论 -
【AI实战】[pytorch版]基于ResNet50的分类模型转onnx
ResNet50转onnx原创 2022-12-27 10:05:15 · 2108 阅读 · 0 评论 -
【AI实战】Pytorch版使用预训练卷积神经网络快速训练自己的分类模型
Pytorch版使用预训练卷积神经网络快速训练自己的分类模型原创 2022-12-07 17:16:08 · 1933 阅读 · 0 评论 -
python3图像加高斯噪声
python3 图像加高斯噪声原创 2022-11-25 10:40:08 · 4533 阅读 · 0 评论 -
AI实战:2019、2020最新的中文文本检测检测模型
2019、2020最新的中文文本检测检测模型1、DBNet(Real-time Scene Text Detection with Differentiable Binarization)论文地址:https://arxiv.org/pdf/1911.08947.pdf作者:华中科技大学 Minghui Liao 1∗ , Zhaoyi Wan 2∗ , Cong Yao 2 , Kai Chen 3,4 , Xiang Bai 1网络结构创新点在基于分割的文本检测网络中,最终原创 2020-11-07 09:02:16 · 2622 阅读 · 0 评论 -
AI实战:生成对抗网络 GAN 开源代码汇总
生成对抗网络 GAN 在机器视觉中的应用开源代码汇总CycleGAN and pix2pix in PyTorchstar: 12.7 K地址:https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix论文地址:https://arxiv.org/pdf/1703.10593.pdf示例图pix2pixHDstar: 4.7 K地址:https://github.com/NVIDIA/pix2pixHD介绍Pytorc原创 2020-08-29 08:45:02 · 2203 阅读 · 1 评论 -
AI实战:一种新的深度目标检测架构 Matrix Nets
Matrix Nets: A New Deep Architecture for Object DetectionAP在MS COCO上实现了47.8的mAPAP比较Matrix Networks(a) Shows the original FPN architecture(b) Shows the MatrixNet architecture, where the 5 FPN layers are viewed as the diagonal layers in the mat原创 2020-07-25 08:44:27 · 448 阅读 · 0 评论 -
AI实战:pytorch版ResNet迁移学习
前言我的另外一篇基于tensorflow的迁移学习文章:AI实战:迁移学习之使用ResNet做分类本文介绍pytorch版ResNet迁移学习。本质:迁移学习到的是特征。加载预训练模型特征层 model.features分类层 model.classifier构建base model,作为特征层model = models.densenet18(pretrained=True)其他的网络可以参考: https://pytorch.org/docs/0.3.0/torchvisio原创 2020-07-19 10:10:33 · 1565 阅读 · 0 评论 -
AI实战:最强文本检测模型Shape Robust Text Detection with Progressive Scale Expansion Network (PSENet)
文本行检测模型PSENet原创 2020-07-11 11:36:15 · 746 阅读 · 0 评论 -
AI实战:pytorch版DenseNet迁移学习
我的另外一篇迁移学习文章:AI实战:迁移学习之使用ResNet做分类构建base model,作为Feature Extractionmodel = models.densenet121(pretrained=True)其他的网络可以参考: https://pytorch.org/docs/0.3.0/torchvision/models.html#torchvision-models2、Fine-Tuninghttps://www.jianshu.com/p/19eb2075effe原创 2020-07-04 07:28:36 · 2951 阅读 · 0 评论 -
AI实战:pytorch、 tensorflow 对比之推理时性能、GPU占用对比(一):DenseNet
本文分享推理时性能、GPU占用对比:pytorch 与 tensorflow 上的对比。DenseNet定义论文链接:Densely Connected Convolutional Networks参考:深度/机器学习基础知识要点:CNN、ResNet、DenseNetDenseNet参数参数情况flops对比DensetNet201在pytorch、tensorflow的情况图片输入尺寸80 × 80模型文件大小对比平台模型文件大小(单位:M)原创 2020-06-21 08:14:26 · 2188 阅读 · 0 评论 -
图像对齐(图像配准)方法记录
图像对齐方法1、基于ORB特征的方法1、检测两张图的ORB特征点2、特征匹配3、计算单应性矩阵4、扭转图片具体的代码实现可以参考这篇文章:https://blog.youkuaiyun.com/yuanlulu/article/details/82222119?utm_source=blogxgwz72、图像模板匹配 + OCR识别验证1、在原图中获取模板图及对应的字符串(OCR识别即可得到)2、在目标图片上进行图像模板匹配3、对匹配到的结果进行OCR识别4、验证模板字符串与OCR识别结果原创 2020-05-31 16:40:52 · 6399 阅读 · 0 评论 -
AI实战:深度学习之人脸识别 Face recognition
前言人脸识别是机器视觉最成熟、最热门的领域,近几年,人脸识别已经逐步超过指纹识别成为生物识别的主导技术。人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。【人脸识别:来源百度百科】人脸识别系统主要包括四个组成部分,分别为:人脸图像...原创 2020-05-17 09:53:52 · 6566 阅读 · 0 评论 -
AI实战:目标检测模型应用之生活垃圾图片分类
前言大赛介绍“华为云杯”2020深圳开放数据应用创新大赛·生活垃圾图片分类 链接https://blog.youkuaiyun.com/weixin_38208912/article/details/103817188https://zhuanlan.zhihu.com/p/96033452目标检测模型实战过程数据增强模型选取开源代码...原创 2020-05-01 20:28:23 · 3633 阅读 · 0 评论 -
AI实战: YOLOv4: Optimal Speed and Accuracy of Object Detection
前言YOLOv4: Optimal Speed and Accuracy of Object Detection [Submitted on 23 Apr 2020] 【是的,你没看错,2020年04月23日,YOLO v4终于来了。】YOLO v4 论文:https://arxiv.org/abs/2004.10934YOLO v4 开源代码:https://github.com/Al...原创 2020-04-24 23:10:28 · 1382 阅读 · 0 评论 -
AI实战:YOLK: Keras Object Detection API
YOLKYOLK为You Only Look Keras的缩写,是Keras的一站式对象检测API。通过几行代码,可以设置性能最佳的模型之一并将其应用于自己的数据集,轻松地训练自己的目标检测模型。Github地址https://github.com/KerasKorea/KerasObjectDetector安装(Linux)# Download YOLK API $ git clo...原创 2020-03-07 19:26:50 · 990 阅读 · 0 评论 -
AI实战:图像数据增强方法汇总
数据集增强方法1、图片缩放图像缩放便是调节图片的分辨率,可利用opencv-python库resize()函数对图片分辨率进行调节,在实际调节过程中,我们应保持在一定范围内,可根据实验反馈效果进行调整。2、图片旋转图像按照给定的角度旋转,可使用opencv-python中getRotationMatrix2D()函数和warpAffine()函数。示例代码:height, wid...原创 2020-02-07 09:25:32 · 3060 阅读 · 0 评论 -
AI实战:谷歌 EfficientNet
前言目前提高CNN精度的方法,主要是通过任意增加CNN深度或宽度,或使用更大的输入图像分辨率进行训练和评估。EfficientNet的成绩EfficientNet-B7在ImageNet上实现了最先进精度的84.4%(Top 1)、97.1%(Top 5),同时比最好的现有ConvNet小84倍,推理速度快6.1倍;在CIFAR-100(91.7%)、Flower(98.8%)和其他3个...原创 2020-01-18 09:33:19 · 912 阅读 · 0 评论 -
AI实战:Object detection之CenterNet
CenterNet论文链接查看1904.07850论文解析查看实验结果 实验结果表明 CenterNet 获得了47%的AP,超过了所有已知的 one-stage 检测方法。CenterNet实现之pytorch源码链接点击查看源码mAPCenterNet实现之pytorch 2源码链接点击查看源码CenterNet实现之tensorf...原创 2019-12-28 09:15:03 · 739 阅读 · 0 评论 -
AI实战:高准确率的检测模型FPN、Mask R-CNN、CenterNet
深度学习高准确率的检测模型FPN1、代码地址:https://github.com/DetectionTeamUCAS/FPN_Tensorflow2、Feature Pyramid Networks for Object Detection论文https://arxiv.org/abs/1612.031443、准确率:Mask R-CNN1、代码地址https://g...原创 2019-11-30 14:24:32 · 1337 阅读 · 0 评论 -
AI实战:迁移学习之使用ResNet做分类
迁移学习包括:1、Feature Extraction2、Fine-Tuning本文基于 tensorflow2.0,使用 cats_vs_dog 数据集,应用 tf.keras.applications 创建 base model核心代码:'''Transfer learning with a pretrained ConvNet: resnet101参考:https:...原创 2019-11-24 20:00:07 · 2419 阅读 · 4 评论 -
AI实战:OCR模型之训练数据自动生成
前言前段时间,项目中的一个核心模块中需要中文OCR功能,模型架构可以参考我的上一篇文章:AI实战:用DenseNet + CTC搭建中文OCR模型 。深度学习模型的上限取决于2个方面:1、模型网络结构2、训练数据本文意在提供一种OCR数据自动生成的方法。实战涉及技术文本处理图像处理(PIL、opencv)流程图重要说明文本语料语料取决于OC...原创 2019-08-04 09:01:23 · 9214 阅读 · 0 评论 -
AI实战:用DenseNet + CTC搭建中文OCR模型
前言前段时间,项目中的一个核心模块中需要中文OCR功能,走过弯路趟过坑,这里分享出来。实战常见网络架构crnn + blstm + ctccrnn + ctccrnn + self_attetion + ctccrnn + attetion + ctcgithub上面测试的结果地址:https://github.com/senlinuc/caffe_ocr...原创 2019-08-03 08:14:49 · 12262 阅读 · 56 评论 -
AI实战:使用DenseNet网络搭建手写数字识别模型
前言前段时间,项目中的一个小5模块中用到了手写数字识别,走过弯路趟过坑,这里分享出来。实战手写数字分类模型v1.01、使用ResNet网络搭建模型2、github开源代码:https://github.com/Curt-Park/handwritten_digit_recognition3、模型训练准确率:99.6%4、训练准确率如此之高,以为万事大吉。在随后的项目实际使用中,...原创 2019-08-02 23:27:19 · 4514 阅读 · 0 评论 -
AI实战:上海垃圾分类系列(二)之快速搭建垃圾分类模型后台服务
快速搭建垃圾分类模型后台服务原创 2019-07-06 18:32:35 · 6763 阅读 · 1 评论 -
AI实战:AI模型部署系列之docker
AI模型部署系列之多docker原创 2019-07-15 20:16:08 · 10380 阅读 · 0 评论 -
AI实战:深度学习模型压缩:模型裁剪——Pruning with Tensorflow
前言从工程角度来说,模型压缩其目的是将算法更稳定、高效的落地在硬件平台上,效率是其追求的目标。复杂的模型固然具有更好的性能,但是高额的存储空间、计算资源消耗是使其难以有效的应用在各硬件平台上。本文总结深度学习模型裁剪的一些方法及开源代码分享。模型裁剪深度学习模型裁剪方法:1、剪枝2、权值共享3、量化4、神经网络二值化Pruning经典开源代码及论文1、《T...原创 2019-08-24 10:06:36 · 8371 阅读 · 0 评论 -
AI实战:深度学习模型压缩:模型裁剪——Pruning with Keras
前言上一篇文章 AI实战:深度学习模型压缩:模型裁剪——Pruning with Tensorflow 介绍了使用Tensorflow裁剪模型的方法,本文继续介绍使用Keras裁剪模型的方法及源码分享。模型裁剪1、《Train sparse TensorFlow models with Keras》 【TF官网方法】核心思想:对neural network’s weight ten...原创 2019-08-24 10:10:59 · 6670 阅读 · 0 评论 -
CV名词解释:候选区域方法(region proposal method)
候选区域方法(region proposal method):首先,我们首先将每个像素作为一组。然后,计算每一组的纹理,并将两个最接近的组结合起来。但是为了避免单个区域吞噬其他区域,我们首先对较小的组进行分组。我们继续合并区域,直到所有区域都结合在一起。下图展示了区域增长过程:下图中蓝色矩形代表合并过程中所有可能的 ROI:...原创 2019-09-01 09:51:50 · 3004 阅读 · 0 评论 -
AI实战:基于深度学习的目标检测算法汇总:R-CNN系列 (R-CNN、Fast R-CNN、Faster R-CNN)
前言计算机视觉领域的八大任务:图像分类目标检测图像语义分割场景文字识别图像生成人体关键点检测视频分类度量学习本文分享基于深度学习的目标检测算法,以及一些好的开源代码。目标检测算法1、R-CNN系列R-CNNR-CNN 流程图: 要点:R-CNN 利用 候选区域方法 创建了约 2000 个 ROI(region of interest 感兴趣区域)...原创 2019-09-01 10:20:27 · 1516 阅读 · 0 评论 -
AI实战:基于深度学习的目标检测算法汇总:SSD、YOLO系列、FPN
前言上一篇文章:AI实战:基于深度学习的目标检测算法汇总:R-CNN系列 (R-CNN、Fast R-CNN、Faster R-CNN) 本文继续基于深度学习的目标检测算法汇总:SSD、YOLO系列SSDSSD的流程图:要点:采用多尺度特征图独立检测源码分享A Keras port of Single Shot MultiBox Detector ...原创 2019-09-01 10:58:49 · 1909 阅读 · 0 评论 -
AI实战:人体姿态估计/跟踪算法(Human Pose Estimation/Tracking)开源汇总
前言人体骨架是以图形形式对一个人的方位所进行的描述。先看个人体骨架示例图:骨架是一组坐标点,可以连接起来以描述该人的位姿。骨架中的每一个坐标点称为一个“部分(part)”(或关节、关键点)。两个部分之间的有效连接称为一个“对(pair)”(或肢体)。多人姿态估计,示例图:开源汇总OpenPose论文https://arxiv.org/pdf/1812.08008....原创 2019-09-07 09:26:43 · 7510 阅读 · 1 评论 -
AI实战:深度学习必须使用大量数据?数据量对深度学习的重要性可能超乎你的想象!
前言《数据量不够大,别玩深度学习》2017年 Jeff Leek 在 Simply Stats 上发表了一篇题为《数据量不够大,别玩深度学习》(Don’t use deep learning your data isn’t that big)的博文。作者指出,当样本数据集很小时,简单的线性模型也能优于深度网络模型的。为了证明自己的论点,Leek 举了一个基于 MNIST 数据库进行图像识别的...原创 2019-09-21 10:34:48 · 17263 阅读 · 0 评论 -
AI实战:上海垃圾分类系列(一)之快速搭建垃圾分类模型
快速搭建垃圾分类模型原创 2019-07-06 10:08:54 · 20156 阅读 · 138 评论