AI--深度学习_老张谋的博客-优快云博客

AI--深度学习

关注

文章平均质量分 75

本专栏包含opencv图像处理、Pytorch框架，目标检测、语义分割等计算机视觉方向，主要记录学习笔记

关注数：文章数：26 文章阅读量：31242 文章收藏量：96

作者: 老张谋

13137730606@163.com

展开

第五章 Opencv图像处理框架实战 5-10 文档扫描OCR识别

这里透视变化是指，假设原图4个点的坐标为ABCD，分别是左上↖，右上↗，右下↘，左下↙，四个坐标，变换后是EFGH，E（0，0），F(w，0), G(w, h), H(h, 0)该函数输入的参数分别是，原图和4个坐标点，原图是没有经过resize的，而输入的坐标点是resize后的，所以需要转换到resize之前，screenCnt.reshape(4, 2) * ratio，这里（4，2）代表总共4个点，每个点的有两个坐标（x,y)，这个东西也是非常强大，给定图片之后，直接能识别图片里面的文字。

原创 2023-08-15 18:05:43 · 882 阅读 · 0 评论
caffe入门基础篇

目录一、caffe配置文件介绍二、标准层的定义三、网络微调技巧四、Linux脚本使用及LMDB文件生成五、带你设计一个Caffe网络，用于分类任务一、caffe配置文件介绍二、标准层的定义三、网络微调技巧其中，multistep最为常用四、Linux脚本使用及LMDB文件生成五...

原创 2019-02-12 17:28:40 · 1400 阅读 · 0 评论
caffe ubuntu14.04 截屏版

本文是将我的文档截屏分享给大家，不至手动编辑出现错误，望见谅！其中opencv ，cudnn 的版本可以按自己的意愿进行替换的。

原创 2017-03-21 22:58:03 · 638 阅读 · 0 评论
ubuntu 14.04 caffe 安装教程完整版

直接将Word 文档的内容复制过来，很麻烦，排版有问题。有需要的可以私信我，我将会邮件过去。本文档，是总结好的，可以直接照着来做的。每个步骤都是没问题的。参考欧新宇教程：http://ouxinyu.github.io/Blogs/20140723001.html 特别说明：本文使用2015年5月5日下载的caffe-master版本，运行平台为：Ubuntu 14.04，CUDA7.5，cu

原创 2017-03-21 22:46:01 · 595 阅读 · 0 评论
caffe Ubuntu14.04 安装教程及出现的问题，解决办法

本文和之前的2篇内容是一样，增加了安装过程出现的常见问题，并提供了解决办法。前2篇是为了思路清晰，没补充安装中出现的问题。本篇是我自己的总结，仅供大家参考，由于Ubuntu系统的特点就是，相同的问题，用相同的解决办法，有些人管用，有些人用就是不管用，这是我的经验。安装了无数次啊。二、MKL与CUDA的环境设置下载caffe

原创 2017-03-21 23:21:42 · 407 阅读 · 0 评论
Learning Deconvolution Network for Semantic Segmentation

Learning Deconvolution Network for Semantic Segmentation 摘要1. 提出新的语义分割算法：深度反卷积网络；2. 在VGG-16卷积层上学习网络；3. 反卷积组成：deconvolution and unpooling layers，识别逐像素的类别标签和预测的分割mask；4. 将object proposal（edge box）送入训

原创 2017-03-21 22:08:36 · 1116 阅读 · 0 评论
scribble semantic segmentation

本文只是将平常做的笔记，截屏发布了，为了省事，嘻嘻嘻嘻，望见谅！

原创 2017-03-21 21:56:24 · 754 阅读 · 0 评论
Instance-aware Semantic segmentation （MNC）笔记

笔记仅供参考，如有错误请批评指正！

原创 2017-03-22 15:25:46 · 930 阅读 · 0 评论
Decoupled deep neural network for semi-supervised semantic segmentation 笔记

原创 2017-03-22 15:20:19 · 930 阅读 · 0 评论
数组保存为 txt, npy, csv 文件，数组遍历enumerate

Numpy提供了几种数据保存的方法。以3*4数组a为例： 1. a.tofile("filename.bin") 这种方法只能保存为二进制文件，且不能保存当前数据的行列信息，文件后缀不一定非要是bin，也可以为txt，但不影响保存格式，都是二进制。这种保存方法对数据读取有要求，需要手动指定读出来的数据的的dtype，如果指定的格式与

原创 2017-06-28 08:29:43 · 4016 阅读 · 0 评论
图像主题色代码 --code， Windows

图像主题色提取算法——code本文主要任务： run code配置： Windows， anoconda python 2.7源码 https://github.com/rainyear/ImageColorTheme错误：无法 import cv2 模块解决办法：Windows 上安装 opencv 最简单的办法就是，从opencv 官网下载

原创 2017-06-29 10:14:37 · 776 阅读 · 0 评论
如何制作自己的数据集

如何制作自己的数据集 1. 本例数据只用了3类：摄像机，飞机，蝴蝶2.创建一个包含所有文件路径名的CSV文件，也就是一个文本文件txt加入文件路径是：C:\Users\*****\Desktop，在DOS窗口下输入命令：如下图所示，执行成功后发现在识别数据库文件夹下出现一个文本文件at.txt：3.生成的txt文件如下：4. 添加标

原创 2017-10-31 16:21:00 · 9692 阅读 · 2 评论
XGBoost

XGBoost 参数，调优方案，优势

转载 2017-06-26 14:17:04 · 4437 阅读 · 0 评论
深度神经网络修改常用tricks

深度神经网络修改常用tricksSPP金字塔结构SPP金字塔结构import mathimport torchimport torch.nn.functional as F# 构建SPP层(空间金字塔池化层)class SPPLayer(torch.nn.Module): def __init__(self, num_levels, pool_type='max_pool'): super(SPPLayer, self).__init__() sel

原创 2020-12-04 15:27:21 · 426 阅读 · 0 评论
深度学习模型下接口编写及Docker下生产环境部署（万能篇）

深度学习模型下接口编写及Docker下生产环境部署（通用篇）一、实现目标二、操作背景三、编写接口1.detect_image.py源代码2.detect_image.py增加接口代码四、服务端代码五、客户端接口六、docker生产环境部署1、docker常用命令一、实现目标通过阅读本篇文章，大家将会了解以下内容：如何编写深度学习模型的接口。如何撰写服务端和客户端。如何利用docker进行生产环境部署。在部署中了解docker相关知识。二、操作背景最最基础的就是大家要有一个跑的通的代码。

原创 2021-01-28 17:34:14 · 2143 阅读 · 1 评论
第五章 Opencv图像处理框架实战 5-6边缘检测

计算出来dtmp1点的梯度值后，比较dtmp1，C，dtmp2三点的梯度值，如果C点的梯度值比他们都大，则保留，否则被抑制掉。3) 应用非极大值（Non-Maximum Suppression）抑制，以消除边缘检测带来的杂散响应。4) 应用双阈值（Double-Threshold）检测来确定真实的和潜在的边缘。1) 使用高斯滤波器，以平滑图像，滤除噪声。2) 计算图像中每个像素点的梯度强度和方向。5) 通过抑制孤立的弱边缘最终完成边缘检测。

原创 2023-08-04 16:52:42 · 97 阅读 · 0 评论
第五章 Opencv图像处理框架实战 5-8直方图与傅里叶变化

import cv2 #opencv读取的格式是BGRimport matplotlib.pyplot as plt#Matplotlib是RGB我们生活在时间的世界中，早上7:00起来吃早饭，8:00去挤地铁，9:00开始上班。。。以时间为参照就是时域分析。但是在频域中一切都是静止的！傅里叶分析之掐死教程（完整版）更新于2014.06.06 - 知乎。

原创 2023-08-06 10:42:12 · 511 阅读 · 0 评论
4.5 基于经典网络架构训练图像分类模型

上面最后两行是一个avgpool层和fc层，我们发现最后一层fc已经变成102。读取标签对应的实际名字。以上代码不用改，基本固定。

原创 2023-07-26 14:57:00 · 72 阅读 · 0 评论
4.7 LSTM文本分类实战

由于上面是双向的，输出特征则是双倍，双向的特征串联起来，所以下面代码的输入特征大小是：此全连接层，用于预测各自类别。

原创 2023-07-29 17:48:14 · 141 阅读 · 0 评论
第五章 Opencv图像处理框架实战 5-4图像形态学操作

礼帽 = 原始输入-开运算结果，原始图像有毛边，开运算结果没有毛边，两者相减，得到毛边。原图像有毛刺，经过腐蚀原图像变细，腐蚀图像在经过膨胀操作，又变粗。梯度运算就是，先膨胀，在腐蚀，最后膨胀的-腐蚀的图像。笔运算会导致毛边越来越大，无法去除毛边。黑帽 = 闭运算-原始输入，

原创 2023-07-31 00:10:35 · 81 阅读 · 0 评论
第五章 Opencv图像处理框架实战 5-1 节课程简介与环境配置

考虑到opencv专利问题，为跑通算法，需要安装opencv-python==3.4.1.15版本，这要求python==3.6环境配置参考如下链接（opencv安装、pycharm配置）。注意：第五章之后需要创建新的环境Anaconda默认Python3.8版本创建Python3.6版本环境并安装opencv3.4.1.15，使用pycharm作为IDE_清华源anaconda哪个是python3.8.3版本_胡萝卜要削皮的博客-优快云博客需要装下面两个包。

原创 2023-07-30 00:36:49 · 100 阅读 · 0 评论
第五章 Opencv图像处理框架实战 5-7图像金字塔与轮廓检测

¶高斯金字塔拉普拉斯金字塔。

原创 2023-08-05 15:52:55 · 146 阅读 · 0 评论
第五章 Opencv图像处理框架实战 5-5图像梯度计算

laplacian算子对噪音比较敏感，通常需要跟其他算法结合在一起使用，后续会讲解。白到黑是正数，黑到白就是负数了，所有的负数会被截断成0，所以要取绝对值。Scharr算子的值显示离得近值大，离得远得值小，让结果更敏感一些。分别计算x和y，再求和。

原创 2023-08-04 12:44:02 · 91 阅读 · 0 评论
4.8 Pytorch框架Flask部署例子

【代码】4.8 Pytorch框架Flask部署例子。

原创 2023-07-29 21:30:52 · 87 阅读 · 0 评论
第五章 Opencv图像处理框架实战 5-9 信用卡数字识别

给定一张信用卡，我们期望达到如下效果给定一个信用卡，最终要输出上面的卡号，且需要在原图中把卡号的位置圈出来。本质上，这是一个模板匹配任务，如果想让计算机认识数字，我们需要给定一个模板，比如下面这个：这样，我们只要找到信用卡上的数字区域，然后拿着数字区域的数字一一与模板进行匹配，看看到底是啥数字，就能识别出来了。但是，对于信用卡来说我们需要找到它的数字区域呀，对于给定的模板，我们虽然有它的数字区域，但是也得分割成一个个的数字，才能进行匹配工作呀，所以该任务，就转成了。

原创 2023-08-07 11:50:01 · 694 阅读 · 0 评论
第五章 Opencv图像处理框架实战 5-2 图像基本操作

每一张图像都是有像素点组成的，每个像素点由3个值，RGB，每个通道的值取值范围在0-255之间，值越大图像越亮。图像大小表示成h*w*c，比如一张500*500*3的图像，则每个通道大小都是500*500，且每一个通道的值，都表示成矩阵形式，则R通道的矩阵大小为500*500.假设图像猫为X1，狗为X2，融合后的图像Y=a * X1+b*X2+C, 其中a 为猫的权重， b为狗的权重，C为整体额外再提升多少亮度。其中：cv2.waitKey(0) 中的0表示显示的图像键盘。表示图像的(h,w,c)

原创 2023-07-30 18:31:04 · 80 阅读 · 0 评论

AI--深度学习

作者: 老张谋

第五章 Opencv图像处理框架实战 5-10 文档扫描OCR识别

caffe入门基础篇

caffe ubuntu14.04 截屏版

ubuntu 14.04 caffe 安装教程 完整版

caffe Ubuntu14.04 安装教程 及 出现的问题，解决办法

Learning Deconvolution Network for Semantic Segmentation

scribble semantic segmentation

Instance-aware Semantic segmentation （MNC）笔记

Decoupled deep neural network for semi-supervised semantic segmentation 笔记

数组 保存为 txt, npy, csv 文件， 数组遍历enumerate

图像主题色 代码 --code， Windows

如何制作自己的数据集

XGBoost

深度神经网络修改常用tricks

深度学习模型下接口编写及Docker下生产环境部署（万能篇）

第五章 Opencv图像处理框架实战 5-6边缘检测

第五章 Opencv图像处理框架实战 5-8直方图与傅里叶变化

4.5 基于经典网络架构训练图像分类模型

4.7 LSTM文本分类实战

第五章 Opencv图像处理框架实战 5-4图像形态学操作

第五章 Opencv图像处理框架实战 5-1 节课程简介与环境配置

第五章 Opencv图像处理框架实战 5-7图像金字塔与轮廓检测

第五章 Opencv图像处理框架实战 5-5图像梯度计算

4.8 Pytorch框架Flask部署例子

第五章 Opencv图像处理框架实战 5-9 信用卡数字识别

第五章 Opencv图像处理框架实战 5-2 图像基本操作

ubuntu 14.04 caffe 安装教程完整版

caffe Ubuntu14.04 安装教程及出现的问题，解决办法

数组保存为 txt, npy, csv 文件，数组遍历enumerate

图像主题色代码 --code， Windows