MarkJhon-优快云博客

原创 CUDA C并行编程：开发环境搭建

英伟达几乎所有GPU都支持CUDA架构，可以在英伟达网站上找到支持CUDA的GPU的详细列表，网址https://developer.nvidia.com/cuda-gpus.（7）nvcc将分别编译.cu文件中的Host和Device代码，前者是通过系统自带的GCC编译器编译，后者是通过CUDA C前端等工具进行。安装后，在用户Home目录下，编译执行~/NVIDIA_CUDA-x.x_Samples/下面的deviceQuery例子，如成功编译执行，那么环境安装正确。（1）支持CUDA的GPU；

2023-10-04 09:46:02 464

原创图谱滤波（Graph Spectral Processing）-1

时域和空域信号的滤波是图像处理的基本技术之一，迄今已得到广泛的研究。Graph Spectral Processing(GSP)可以处理不规则结构的信号，这些信号在数学上用图形表示。利用谱图理论研究了图信号滤波的理论和方法。在图像处理中，图是表示像素形成的结构的强有力工具，如边和纹理。图信号的滤波不仅是对标准时域和空域信号滤波的扩展，而且具有自身的性质特点。例如，GSP可以将传统的基于像素的图像滤波方法表示为图谱域滤波器。

2023-10-04 09:09:07 426

原创使用深度学习模型对视频进行聚类分析-Pytorch、Skleran、Matplotlib

【代码】使用深度学习模型对视频进行聚类分析-Pytorch、Skleran、Matplotlib。

2023-07-31 15:34:12 1262

原创基于相邻帧差异判断固定相机拍摄的视频运动情况（Python）

直方图阈值设置为2000以下，视为该视频人体未发生运动，由于肢体像素相同，识别误差显著，存在较大误差。

2023-05-16 09:03:04 242

原创用于服务器推视频流、接收视频流的C++语言的端口代码，使用RTSP协议和socket和TCP协议

C++语言实现，SRS流服务器、GPU推理服务器、本地App的三方端口的推流、取流和推理结果发送的代码，使用RTSP协议和socket、TCP协议。

2023-05-15 15:13:41 981 2

原创目标检测：YOLO+Opencv

在篇博文中，我们将学习如何使用YOLO对象检测器来检测图像和视频流中的目标，其中用到了深度学习、OpenCV和Python。目标检测，不仅要确定图像中目标类别，而且还要确定给定目标在图像中的驻留位置。首先简单讨论一下YOLO对象检测器，包括目标检测器如何流程：（1）将YOLO对象检测器应用于图像（2）将YOLO应用于视频流。并在后面，讨论一下YOLO对象检测器的一些缺点，包括个人的一些技巧和建议。1、YOLO对象检测器介绍关于深度学习的目标检测，你会遇到三种主要的对象检测器:（1）R-.

2021-10-08 10:19:14 2239

原创深度学习：激活函数（Activation Functions ）

激活函数指的是，我们在应用于神经网络中的函数，(通常)应用于在输入特征结合权重和输入特征应用仿射变换操作之后。激活函数是典型的非线性函数。ReLU是过去十年中最流行的一种。激活函数的选择与网络结构有关，而且近年来出现了许多替代方案。1、...

2021-10-05 16:17:38 1201

原创计算机视觉：Vision Transformers

Vision Transformers是应用于视觉任务的Transformers模型。它们来源于ViT的工作，ViT直接将Transformer架构应用于不重叠的中型图像块上进行图像分类。1、Vision Transformer （ViT）Vision Transformer(简称ViT)是一种用于图像分类的模型，它在图像的补丁上采用了类似Transformer的结构进行图像分类任务。输入图像被分割成固定大小的块，然后线性嵌入每个块，添加位置嵌入（Position Embeding），并将得到的向量

2021-10-05 13:10:47 2291

原创注意力机制学习：Multi-Head Attention

多头注意力机制（Mutil-head Attention）：多头注意( Multihead Attention )是注意机制模块。实现：通过一个注意力机制的多次并行运行，将独立的注意力输出串联起来，线性地转化为预期维度。直观看来，多个注意头允许对序列的不同部分进行注意力运算。其中，都是可学习的参数矩阵。注：缩放点积注意力（Scaled dot-product attention)在这个模块中很常用的，同时也可以将其换为其他类型的注意力机制。import numpy...

2021-10-04 15:29:59 3749

原创解决样本不平衡方法：Focal Loss

Focal Loss的作用：主要是为了解决目标检测任务中类别不平衡问题。Focal Loss应用一个调制项到交叉熵损失函数上，以集中学习困难的负面例子。通过使用缩放因子（scaling factor）控制交叉熵损失的动态缩放。缩放因子随着正类别的置信度增加，缩放因子衰减为零。直观看来，该缩放因子可自动降低训练过程中Easy example的权重，并快速将模型集中在难样本（hard example）上。公式表达上，Focal Loss为标准交叉熵标准增加了一个因子。设置降低分类较好的样本损失（

2021-10-04 14:48:47 513

原创 GAN in action: Implement Autoencoder

使用Tensorflow和keras构建自编码器Let's get started!Define some key variables.Define sampling helper function.Define the encoder.Define the decoder.Define the Variational Autoencoder(VAE).Define the loss and run our model.Load Mnist Dataset.Generate new image .Let’

2020-12-09 17:01:57 318

原创代码记录：Spatial pyramid pooling Implementation

import numpy as npimport mathimport tensorflow as tf#inupt_feature maps if of the form: N, C, H, Wdef np_spatial_pyramid_pooling(input_feature_maps, spatial_pyramid, dtype=np.float32): assert input_feature_maps.ndim == 4 assert spatial_pyrami.

2020-12-08 15:27:58 160

原创目标检测面试：IOU计算+mAP计算（Python+pytorch计算实现）

def iou(boxA, boxB): #计算重合部分的上下左右4个边的值，注意最大最小函数的使用 left_max = max(boxA[0], boxB[0]) top_max = max(boxA[1], boxB[1]) right_min = min(boxA[2], boxB[2]) bottom_min = min(boxA[3], boxB[3]) #计算重合部分面积 inter = max(0, (right_min-left_m.

2020-12-02 09:08:57 2902 4

原创注意力机制热力图可视化

import tensorflow as tfimport numpy as npimport cv2def visualize_attention_map(attention_map): """ The attention map is a matrix ranging from 0 to 1, where the greater the value, the greater attention is suggests. :param attention_map.

2020-12-01 13:11:51 20423 7

翻译集于Yolo3的目标检测模型（百度AiStudio）

简介YOLOv3 是由 Joseph Redmon 和 Ali Farhadi 提出的单阶段检测器, 该检测器与达到同样精度的传统目标检测方法相比，推断速度能达到接近两倍.模型结构YOLOv3将输入图像分成S*S个格子，每个格子预测B个bounding box，每个bounding box预测内容包括: Location(x, y, w, h)、Confidence Score和C个类别的概率，因此YOLOv3输出层的channel数为B*(5 + C)。YOLOv3的loss函数也有三部分组成

2020-07-13 17:16:00 1686 1

原创 Tensorflow如何使用GPU训练（笔记）

Tensorflow和tf.keras 模型可以在单个GPU上透明运行，而无需更改。注意：（1）需要使用tf.config.experimental.list_physical_devices('GPU')确认使用的tensorflow可以使用GPU。（2）在一台机器上运行多个GPU，或者在多台机器上运行，最简单的方法是使用分布策略。确保你的机器已经安装TensorflowGPU版。import tensorflow as tfprint("Num GPUs Available: ",

2020-07-12 18:33:03 40534 3

原创 YoloV3使用k-means聚类产生矛框大小（以VOC数据集为例）

import matplotlib.pyplot as pltimport numpy as npimport os, cv2%matplotlib inlineLABELS = ['aeroplane', 'bicycle', 'bird', 'boat', 'bottle', 'bus', 'car', 'cat', 'chair', 'cow', 'diningtable','dog', 'ho.

2020-07-12 16:06:01 3180 3

原创目标检测：获得类别信息

from __future__ import absolute_importfrom __future__ import divisionfrom __future__ import print_functionfrom __future__ import unicode_literalsimport osimport sysimport numpy as npfrom .coco_eval import bbox2outimport logginglogger = logging.

2020-07-10 14:43:36 757

原创目标检测：绘制mask和bbox

from __future__ import absolute_importfrom __future__ import divisionfrom __future__ import print_functionfrom __future__ import unicode_literalsimport numpy as npfrom PIL import Image, ImageDrawfrom .colormap import colormap__all__ = ['visualiz.

2020-07-10 14:39:21 1911

原创设置颜色图

from __future__ import absolute_importfrom __future__ import divisionfrom __future__ import print_functionfrom __future__ import unicode_literalsimport numpy as npdef colormap(rgb=False): """ Get colormap """ color_list = np.array(.

2020-07-10 14:20:46 438

原创目标检测：交并比计算和bbox回归操作

from __future__ import absolute_importfrom __future__ import divisionfrom __future__ import print_functionimport loggingimport numpy as npimport paddle.fluid as fluid__all__ = ["bbox_overlaps", "box_to_delta"]logger = logging.getLogger(__name__.

2020-07-10 08:04:22 948

原创 python环境下opencv学习（1）

检测opencv是否安装"""测试opencv是否安装"""# 导入opencvimport cv2#使用函数cv2。imread（）读入图像#图像应该在工作目录中，或者提供全路径image = cv2.imread("logo.png")#使用cv2.cvtColor()转变图像格式# In this case we use cv2.cvtColor() to conve...

2020-05-06 09:09:46 262

原创数字图像处理—学习日记（2）：图像直方图及均衡化

基本的图像处理操作交互式标注使用PyLab库ginput（）函数进行交互式标注。下面展示代码，脚本首先绘制图像，然后等待用户在图像窗口图像区域点击三次，点击得到的坐标【x, y】自动保存在x列表中。from PIL import Imagefrom pylab imprt *im = array(Image.open('example.jpg'))imshow(im)print...

2020-03-28 10:29:55 390

原创数字图像处理—学习日记（2）：基本的图像操作和处理

使用Matplotlib进行基本图像操作Matplotlib介绍绘制图像、点和线图像轮廓和直方图Matplotlib介绍Matplotlib类库可以进行数字运算，绘制图表，绘制点，直线和曲线等等。绘制图像、点和线用几个点和一条线绘制图像：from PIL import Imagefrom pylab import *#读取图片到数组im = array(Image.open('e...

2020-03-27 21:28:31 395

原创数字图像处理—学习日记（1）：简单的图像读写，转换操作，通过python

1 PIL:python图像处理库（1）PIL最重要的模块为Image，读取一张图像。from PIL import Imagepil_im = Image.open('example.jpg')（2）对读入的图像进行转换，使用Convert（）方法pil_im = Image.open('example.jpg').convert(‘L’)2 对图像格式进行转...

2020-03-27 20:52:55 353

原创人工智能

1.人工智能从1956年诞生至今共经历过三次大的浪潮。第一次：1956年达特茅斯会议之后的十几年是人工智能的第一个黄金时代。代表科学家：约瑟夫·维森班。代表成果：开发了ELIZA，Wabot-1。转入低谷原因：到了70年代后期，由于计算机性能的不足、计算难度的指数级增长以及数据量缺失等问题，人工智能开始遭遇发展瓶颈，人工智能遭遇了发展历史上的第一次低谷。第二次：1982年，随着BP训练算法...

2020-02-20 21:55:20 870

原创实现简单卷积神经网络实现MNIST手写数据集的识别（python+tensorflow）

#MarkJhon#2019/10/04#homework#????四层卷积神经网络，前两个卷积层由covonlution-relu-maxpool操作组成#1，加载必要的编程库，开始计算图绘画import matplotlib.pyplot as pltimport numpy as npimport tensorflow as tffrom tensorflow.contrib...

2019-10-08 17:32:30 1038 1

原创图像处理：对图片进行高斯滤波、均值滤波、中值滤波处理

#高斯均值滤波，对原图中的噪声小点进行删除，但是图片会变模糊import cv2import numpy as npimg = cv2.imread('iamge0.jpg', 1)cv2.imshow('src', img)#使用opencvAPI的形式进行调用dst = cv2.GaussianBlur(img, (5,5), 1.5)cv2.imshow('dst', dst...

2019-07-26 16:25:15 2337 1

原创图像处理：对图片进行彩色直方图均衡化、图片真亮、磨皮美白处理

#实现彩色直方图均衡化import cv2import numpy as npimport matplotlib.pyplot as pltimg = cv2.imread('image0.jpg', 1)cv2.imshow('sec',img)imgInfo = img.shapeheight = imgInfo[0]width = imgInfo[1]count_b ...

2019-07-26 15:13:36 519

原创图像处理：彩色直方图和灰度直方图实现源码

#彩色直方图源码实现#本质：统计每个像素灰度出现的概率X:0-255, Y:Pimport cv2import numpy as npimport matplotlib.pyplot as pltimg = cv2.imread('image0.jpg',1)imgInfo = img.shapeheight = imgInfo[0]width = imgInfo[1]cou...

2019-07-26 14:30:26 414

原创图片处理：对图片进行简单修补、对图片灰度直方图进行绘制

#图片修补import cv2import numpy as npimg = cv2.imread('image0.jpg', 1)#通过代码生成损坏的图片#画一个三像素的直线for i in range(200, 300): img[i, 200] = (255,255,255) img[i, 200+1] = (255, 255, 255) img[i, ...

2019-07-26 11:26:49 263

原创图片处理：对图片进行均衡化处理

#彩色图片直方图import cv2import numpy as np#定义方法，表明直方图的统计def ImageHist(image,type): #定义一个颜色，白色 color = (255, 255, 255) #定义一个windows窗体 windowName = 'Gray' #判断类型 if type == 31: ...

2019-07-26 09:58:18 1107

原创图片处理：绘制线段，矩形，文字和图片

import cv2import numpy as npnewImageInfo = (500, 500, 3)dst = np.zeros(newImageInfo, np.uint8)#绘制线段，目标图片，起点，终点，绘制线段颜色cv2.line(dst, (100,100),(400,400),(0, 0,255))#绘制另一条，其中20为宽度cv2.line(dst, (...

2019-07-25 21:22:05 192

原创图片处理：对图片进行浮雕化、颜色效果强化、油画效果处理

#图片浮雕效果import cv2import numpy as npimg = cv2.imread('image0.jpg', 1)imgInfo = img.shapeheight = imgInfo[0]width = imgInfo[1]#进行灰度转化gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)dst = np.zero...

2019-07-25 20:00:03 642

原创图片处理：图片边缘检测（api调用和源码实现两种方法）

#对图片进行边缘检测，实质：对图片的卷积运算import cv2import numpy as npimport random#实现步骤：1、完成图片灰度处理2、进行高斯滤波，去除噪声干扰3、调用canny完成边缘检测img = cv2.imread('image0.jpg', 1)imgInfo = img.shapeheight = imgInfo[0]width = img...

2019-07-25 16:41:23 1061

原创图片处理：对图片进行马赛克、毛玻璃、图片融合处理

#对图片指定部位进行马赛克处理import cv2import numpy as npimg = cv2.imread('image0.jpg', 1)imgInfo = img.shapeheight = imgInfo[0]width = imgInfo[1]#定义马赛克窗体范围for m in range(100, 300): for n in range(100,...

2019-07-25 15:57:42 630

原创图片处理：完成图片的颜色反转

#完成图像的颜色反转#RGB 255-R = newR#灰度图的颜色反转：0-255 255-当前import cv2import numpy as npimg = cv2.imread('image0.jpg',1)imgInfo = img.shapeheight = imgInfo[0]width = imgInfo[1]#转化为灰度图片gray = cv2.cvtC...

2019-07-25 10:14:49 3762

原创图片处理：完成图片的旋转

#完成图像的旋转import cv2import numpy as npimg = cv2.imread('image0.jpg', 1)imgInfo = img.shapeheight = imgInfo[0]width = imgInfo[1]#定义图像的旋转矩阵，参数1，旋转的中心点，2，旋转的角度，3，缩放的系数matRotate = cv2.getRotationM...

2019-07-25 09:34:25 437

原创图像处理：完成一幅图像的灰度化处理

#完成图像灰度化的处理import cv2import numpy as np#方法1：读入参数调整去灰度图img0 = cv2.imread('image0.jpg', 0)img1 = cv2.imread('image0.jpg', 1)print(img0.shape)print(img1.shape)#图像展示cv2.imshow('src', img0)cv2.w...

2019-07-25 09:23:06 2269

原创图像处理：对图片进行缩放

#实现图片缩放#定义一个2*3的矩阵，[[A1 A2 B1],[A3 A4 B2]]#[[A1 A2],[A3 A4]] [B1 B2]#newX = A1*x+A2*y+B1#newY = A3*x+A4*y+B2# x->0.5*x y->0.5*y#把A1=0.5 A2=0 B1=0 => newX= 0.5*ximport cv2import ...

2019-07-24 19:55:22 485