
AI--深度学习
文章平均质量分 75
本专栏包含opencv图像处理、Pytorch框架,目标检测、语义分割等计算机视觉方向,主要记录学习笔记
老张谋
13137730606@163.com
展开
-
第五章 Opencv图像处理框架实战 5-10 文档扫描OCR识别
这里透视变化是指,假设原图4个点的坐标为ABCD,分别是左上↖,右上↗,右下↘,左下↙,四个坐标,变换后是EFGH,E(0,0),F(w,0), G(w, h), H(h, 0)该函数输入的参数分别是,原图和4个坐标点,原图是没有经过resize的,而输入的坐标点是resize后的,所以需要转换到resize之前,screenCnt.reshape(4, 2) * ratio,这里(4,2)代表总共4个点,每个点的有两个坐标(x,y), 这个东西也是非常强大, 给定图片之后,直接能识别图片里面的文字。原创 2023-08-15 18:05:43 · 882 阅读 · 0 评论 -
caffe入门基础篇
目录一、caffe配置文件介绍二、标准层的定义 三、网络微调技巧四、Linux脚本使用及LMDB文件生成五、带你设计一个Caffe网络,用于分类任务一、caffe配置文件介绍 二、标准层的定义 三、网络微调技巧 其中,multistep最为常用四、Linux脚本使用及LMDB文件生成五...原创 2019-02-12 17:28:40 · 1400 阅读 · 0 评论 -
caffe ubuntu14.04 截屏版
本文是将我的文档截屏分享给大家,不至手动编辑出现错误,望见谅! 其中opencv ,cudnn 的版本可以按自己的意愿进行替换的。原创 2017-03-21 22:58:03 · 638 阅读 · 0 评论 -
ubuntu 14.04 caffe 安装教程 完整版
直接将Word 文档的内容复制过来,很麻烦,排版有问题。有需要的可以私信我,我将会邮件过去。本文档,是总结好的,可以直接照着来做的。每个步骤都是没问题的。参考欧新宇教程:http://ouxinyu.github.io/Blogs/20140723001.html 特别说明: 本文使用2015年5月5日下载的caffe-master版本,运行平台为:Ubuntu 14.04,CUDA7.5,cu原创 2017-03-21 22:46:01 · 595 阅读 · 0 评论 -
caffe Ubuntu14.04 安装教程 及 出现的问题,解决办法
本文和之前的2篇内容是一样,增加了安装过程出现的常见问题,并提供了解决办法。前2篇是为了思路清晰,没补充安装中出现的问题。本篇是我自己的总结,仅供大家参考,由于Ubuntu系统的特点就是,相同的问题,用相同的解决办法,有些人管用,有些人用就是不管用,这是我的经验。安装了无数次啊。 二、MKL与CUDA的环境设置 下载caffe原创 2017-03-21 23:21:42 · 407 阅读 · 0 评论 -
Learning Deconvolution Network for Semantic Segmentation
Learning Deconvolution Network for Semantic Segmentation 摘要1. 提出新的语义分割算法:深度反卷积网络;2. 在VGG-16卷积层上学习网络;3. 反卷积组成:deconvolution and unpooling layers,识别逐像素的类别标签和预测的分割mask;4. 将object proposal(edge box)送入训原创 2017-03-21 22:08:36 · 1116 阅读 · 0 评论 -
scribble semantic segmentation
本文只是将平常做的笔记,截屏发布了,为了省事,嘻嘻嘻嘻,望见谅!原创 2017-03-21 21:56:24 · 754 阅读 · 0 评论 -
Instance-aware Semantic segmentation (MNC)笔记
笔记仅供参考,如有错误请批评指正!原创 2017-03-22 15:25:46 · 930 阅读 · 0 评论 -
Decoupled deep neural network for semi-supervised semantic segmentation 笔记
原创 2017-03-22 15:20:19 · 930 阅读 · 0 评论 -
数组 保存为 txt, npy, csv 文件, 数组遍历enumerate
Numpy提供了几种数据保存的方法。 以3*4数组a为例: 1. a.tofile("filename.bin") 这种方法只能保存为二进制文件,且不能保存当前数据的行列信息,文件后缀不一定非要是bin,也可以为txt,但不影响保存格式,都是二进制。 这种保存方法对数据读取有要求,需要手动指定读出来的数据的的dtype,如果指定的格式与原创 2017-06-28 08:29:43 · 4016 阅读 · 0 评论 -
图像主题色 代码 --code, Windows
图像主题色提取算法——code本文主要任务: run code配置: Windows, anoconda python 2.7源码 https://github.com/rainyear/ImageColorTheme错误: 无法 import cv2 模块 解决办法:Windows 上安装 opencv 最简单的办法就是, 从opencv 官网下载原创 2017-06-29 10:14:37 · 776 阅读 · 0 评论 -
如何制作自己的数据集
如何制作自己的数据集 1. 本例数据只用了3类:摄像机,飞机,蝴蝶2.创建一个包含所有文件路径名的CSV文件,也就是一个文本文件txt加入文件路径是:C:\Users\*****\Desktop,在DOS窗口下输入命令:如下图所示,执行成功后发现在识别数据库文件夹下出现一个文本文件at.txt:3.生成的txt文件如下:4. 添加标原创 2017-10-31 16:21:00 · 9692 阅读 · 2 评论 -
XGBoost
XGBoost 参数,调优方案, 优势转载 2017-06-26 14:17:04 · 4437 阅读 · 0 评论 -
深度神经网络修改常用tricks
深度神经网络修改常用tricksSPP金字塔结构SPP金字塔结构import mathimport torchimport torch.nn.functional as F# 构建SPP层(空间金字塔池化层)class SPPLayer(torch.nn.Module): def __init__(self, num_levels, pool_type='max_pool'): super(SPPLayer, self).__init__() sel原创 2020-12-04 15:27:21 · 426 阅读 · 0 评论 -
深度学习模型下接口编写及Docker下生产环境部署(万能篇)
深度学习模型下接口编写及Docker下生产环境部署(通用篇)一、实现目标二、操作背景三、编写接口1.detect_image.py源代码2.detect_image.py增加接口代码四、服务端代码五、客户端接口六、docker生产环境部署1、docker常用命令一、实现目标通过阅读本篇文章,大家将会了解以下内容:如何编写深度学习模型的接口。如何撰写服务端和客户端。如何利用docker进行生产环境部署。在部署中了解docker相关知识。二、操作背景最最基础的就是大家要有一个跑的通的代码。原创 2021-01-28 17:34:14 · 2143 阅读 · 1 评论 -
第五章 Opencv图像处理框架实战 5-6边缘检测
计算出来dtmp1点的梯度值后,比较dtmp1,C,dtmp2三点的梯度值,如果C点的梯度值比他们都大,则保留,否则被抑制掉。3) 应用非极大值(Non-Maximum Suppression)抑制,以消除边缘检测带来的杂散响应。4) 应用双阈值(Double-Threshold)检测来确定真实的和潜在的边缘。1) 使用高斯滤波器,以平滑图像,滤除噪声。2) 计算图像中每个像素点的梯度强度和方向。5) 通过抑制孤立的弱边缘最终完成边缘检测。原创 2023-08-04 16:52:42 · 97 阅读 · 0 评论 -
第五章 Opencv图像处理框架实战 5-8直方图与傅里叶变化
import cv2 #opencv读取的格式是BGRimport matplotlib.pyplot as plt#Matplotlib是RGB我们生活在时间的世界中,早上7:00起来吃早饭,8:00去挤地铁,9:00开始上班。。。以时间为参照就是时域分析。但是在频域中一切都是静止的!傅里叶分析之掐死教程(完整版)更新于2014.06.06 - 知乎。原创 2023-08-06 10:42:12 · 511 阅读 · 0 评论 -
4.5 基于经典网络架构训练图像分类模型
上面最后两行是一个avgpool层和fc层,我们发现最后一层fc已经变成102。读取标签对应的实际名字。以上代码不用改,基本固定。原创 2023-07-26 14:57:00 · 72 阅读 · 0 评论 -
4.7 LSTM文本分类实战
由于上面是双向的,输出特征则是双倍,双向的特征串联起来,所以下面代码的输入特征大小是:此全连接层,用于预测各自类别。原创 2023-07-29 17:48:14 · 141 阅读 · 0 评论 -
第五章 Opencv图像处理框架实战 5-4图像形态学操作
礼帽 = 原始输入-开运算结果,原始图像有毛边,开运算结果没有毛边,两者相减,得到毛边。原图像有毛刺,经过腐蚀原图像变细,腐蚀图像在经过膨胀操作,又变粗。梯度运算就是,先膨胀,在腐蚀,最后膨胀的-腐蚀的图像。笔运算会导致毛边越来越大,无法去除毛边。黑帽 = 闭运算-原始输入,原创 2023-07-31 00:10:35 · 81 阅读 · 0 评论 -
第五章 Opencv图像处理框架实战 5-1 节课程简介与环境配置
考虑到opencv专利问题,为跑通算法,需要安装opencv-python==3.4.1.15版本,这要求python==3.6环境配置参考如下链接(opencv安装、pycharm配置)。注意:第五章之后需要创建新的环境Anaconda默认Python3.8版本创建Python3.6版本环境并安装opencv3.4.1.15,使用pycharm作为IDE_清华源anaconda哪个是python3.8.3版本_胡萝卜要削皮的博客-优快云博客需要装下面两个包。原创 2023-07-30 00:36:49 · 100 阅读 · 0 评论 -
第五章 Opencv图像处理框架实战 5-7图像金字塔与轮廓检测
¶高斯金字塔拉普拉斯金字塔。原创 2023-08-05 15:52:55 · 146 阅读 · 0 评论 -
第五章 Opencv图像处理框架实战 5-5图像梯度计算
laplacian算子对噪音比较敏感,通常需要跟其他算法结合在一起使用,后续会讲解。白到黑是正数,黑到白就是负数了,所有的负数会被截断成0,所以要取绝对值。Scharr算子的值显示离得近值大,离得远得值小,让结果更敏感一些。分别计算x和y,再求和。原创 2023-08-04 12:44:02 · 91 阅读 · 0 评论 -
4.8 Pytorch框架Flask部署例子
【代码】4.8 Pytorch框架Flask部署例子。原创 2023-07-29 21:30:52 · 87 阅读 · 0 评论 -
第五章 Opencv图像处理框架实战 5-9 信用卡数字识别
给定一张信用卡,我们期望达到如下效果给定一个信用卡,最终要输出上面的卡号,且需要在原图中把卡号的位置圈出来。本质上,这是一个模板匹配任务,如果想让计算机认识数字,我们需要给定一个模板,比如下面这个:这样, 我们只要找到信用卡上的数字区域,然后拿着数字区域的数字一一与模板进行匹配,看看到底是啥数字,就能识别出来了。但是,对于信用卡来说我们需要找到它的数字区域呀,对于给定的模板,我们虽然有它的数字区域,但是也得分割成一个个的数字,才能进行匹配工作呀,所以该任务,就转成了。原创 2023-08-07 11:50:01 · 694 阅读 · 0 评论 -
第五章 Opencv图像处理框架实战 5-2 图像基本操作
每一张图像都是有像素点组成的,每个像素点由3个值,RGB,每个通道的值取值范围在0-255之间,值越大图像越亮。图像大小表示成h*w*c,比如一张500*500*3的图像,则每个通道大小都是500*500,且每一个通道的值,都表示成矩阵形式,则R通道的矩阵大小为500*500.假设图像猫为X1,狗为X2,融合后的图像Y=a * X1+b*X2+C, 其中a 为猫的权重, b为狗的权重,C为整体额外再提升多少亮度。其中:cv2.waitKey(0) 中的0表示显示的图像键盘。表示图像的(h,w,c)原创 2023-07-30 18:31:04 · 80 阅读 · 0 评论