- 博客(61)
- 资源 (5)
- 收藏
- 关注
原创 CUDA C并行编程:开发环境搭建
英伟达几乎所有GPU都支持CUDA架构,可以在英伟达网站上找到支持CUDA的GPU的详细列表,网址https://developer.nvidia.com/cuda-gpus.(7)nvcc将分别编译.cu文件中的Host和Device代码,前者是通过系统自带的GCC编译器编译,后者是通过CUDA C前端等工具进行。安装后,在用户Home目录下,编译执行~/NVIDIA_CUDA-x.x_Samples/下面的deviceQuery例子,如成功编译执行,那么环境安装正确。(1)支持CUDA的GPU;
2023-10-04 09:46:02
464
原创 图谱滤波(Graph Spectral Processing)-1
时域和空域信号的滤波是图像处理的基本技术之一,迄今已得到广泛的研究。Graph Spectral Processing(GSP)可以处理不规则结构的信号,这些信号在数学上用图形表示。利用谱图理论研究了图信号滤波的理论和方法。在图像处理中,图是表示像素形成的结构的强有力工具,如边和纹理。图信号的滤波不仅是对标准时域和空域信号滤波的扩展,而且具有自身的性质特点。例如,GSP可以将传统的基于像素的图像滤波方法表示为图谱域滤波器。
2023-10-04 09:09:07
426
原创 使用深度学习模型对视频进行聚类分析-Pytorch、Skleran、Matplotlib
【代码】使用深度学习模型对视频进行聚类分析-Pytorch、Skleran、Matplotlib。
2023-07-31 15:34:12
1262
原创 基于相邻帧差异判断固定相机拍摄的视频运动情况(Python)
直方图阈值设置为2000以下,视为该视频人体未发生运动,由于肢体像素相同,识别误差显著,存在较大误差。
2023-05-16 09:03:04
242
原创 用于服务器推视频流、接收视频流的C++语言的端口代码,使用RTSP协议和socket和TCP协议
C++语言实现,SRS流服务器、GPU推理服务器、本地App的三方端口的推流、取流和推理结果发送的代码,使用RTSP协议和socket、TCP协议。
2023-05-15 15:13:41
981
2
原创 目标检测:YOLO+Opencv
在篇博文中,我们将学习如何使用YOLO对象检测器来检测图像和视频流中的目标,其中用到了深度学习、OpenCV和Python。目标检测,不仅要确定图像中目标类别,而且还要确定给定目标在图像中的驻留位置。首先简单讨论一下YOLO对象检测器,包括目标检测器如何流程:(1)将YOLO对象检测器应用于图像(2)将YOLO应用于视频流。并在后面,讨论一下YOLO对象检测器的一些缺点,包括个人的一些技巧和建议。1、YOLO对象检测器介绍关于深度学习的目标检测,你会遇到三种主要的对象检测器:(1)R-.
2021-10-08 10:19:14
2239
原创 深度学习:激活函数(Activation Functions )
激活函数指的是,我们在应用于神经网络中的函数,(通常)应用于在输入特征结合权重和输入特征应用仿射变换操作之后。激活函数是典型的非线性函数。ReLU是过去十年中最流行的一种。激活函数的选择与网络结构有关,而且近年来出现了许多替代方案。1、...
2021-10-05 16:17:38
1201
原创 计算机视觉:Vision Transformers
Vision Transformers是应用于视觉任务的Transformers模型。它们来源于ViT的工作,ViT直接将Transformer架构应用于不重叠的中型图像块上进行图像分类。1、Vision Transformer (ViT)Vision Transformer(简称ViT)是一种用于图像分类的模型,它在图像的补丁上采用了类似Transformer的结构进行图像分类任务。输入图像被分割成固定大小的块,然后线性嵌入每个块,添加位置嵌入(Position Embeding),并将得到的向量
2021-10-05 13:10:47
2291
原创 注意力机制学习:Multi-Head Attention
多头注意力机制(Mutil-head Attention):多头注意( Multihead Attention )是注意机制模块。实现:通过一个注意力机制的多次并行运行,将独立的注意力输出串联起来,线性地转化为预期维度。直观看来,多个注意头允许对序列的不同部分进行注意力运算。其中,都是可学习的参数矩阵。注:缩放点积注意力(Scaled dot-product attention)在这个模块中很常用的,同时也可以将其换为其他类型的注意力机制。import numpy...
2021-10-04 15:29:59
3749
原创 解决样本不平衡方法:Focal Loss
Focal Loss的作用:主要是为了解决目标检测任务中类别不平衡问题。Focal Loss应用一个调制项到交叉熵损失函数上,以集中学习困难的负面例子。通过使用缩放因子(scaling factor)控制交叉熵损失的动态缩放。缩放因子随着正类别的置信度增加,缩放因子衰减为零。直观看来,该缩放因子可自动降低训练过程中Easy example的权重,并快速将模型集中在难样本(hard example)上。公式表达上,Focal Loss为标准交叉熵标准增加了一个因子。设置降低分类较好的样本损失(
2021-10-04 14:48:47
513
原创 GAN in action: Implement Autoencoder
使用Tensorflow和keras构建自编码器Let's get started!Define some key variables.Define sampling helper function.Define the encoder.Define the decoder.Define the Variational Autoencoder(VAE).Define the loss and run our model.Load Mnist Dataset.Generate new image .Let’
2020-12-09 17:01:57
318
原创 代码记录:Spatial pyramid pooling Implementation
import numpy as npimport mathimport tensorflow as tf#inupt_feature maps if of the form: N, C, H, Wdef np_spatial_pyramid_pooling(input_feature_maps, spatial_pyramid, dtype=np.float32): assert input_feature_maps.ndim == 4 assert spatial_pyrami.
2020-12-08 15:27:58
160
原创 目标检测面试:IOU计算+mAP计算(Python+pytorch计算实现)
def iou(boxA, boxB): #计算重合部分的上下左右4个边的值,注意最大最小函数的使用 left_max = max(boxA[0], boxB[0]) top_max = max(boxA[1], boxB[1]) right_min = min(boxA[2], boxB[2]) bottom_min = min(boxA[3], boxB[3]) #计算重合部分面积 inter = max(0, (right_min-left_m.
2020-12-02 09:08:57
2902
4
原创 注意力机制热力图可视化
import tensorflow as tfimport numpy as npimport cv2def visualize_attention_map(attention_map): """ The attention map is a matrix ranging from 0 to 1, where the greater the value, the greater attention is suggests. :param attention_map.
2020-12-01 13:11:51
20423
7
翻译 集于Yolo3的目标检测模型(百度AiStudio)
简介YOLOv3 是由 Joseph Redmon 和 Ali Farhadi 提出的单阶段检测器, 该检测器与达到同样精度的传统目标检测方法相比,推断速度能达到接近两倍.模型结构YOLOv3将输入图像分成S*S个格子,每个格子预测B个bounding box,每个bounding box预测内容包括: Location(x, y, w, h)、Confidence Score和C个类别的概率,因此YOLOv3输出层的channel数为B*(5 + C)。YOLOv3的loss函数也有三部分组成
2020-07-13 17:16:00
1686
1
原创 Tensorflow如何使用GPU训练(笔记)
Tensorflow和tf.keras 模型可以在单个GPU上透明运行,而无需更改。注意:(1)需要使用tf.config.experimental.list_physical_devices('GPU')确认使用的tensorflow可以使用GPU。(2)在一台机器上运行多个GPU,或者在多台机器上运行,最简单的方法是使用分布策略。确保你的机器已经安装TensorflowGPU版。import tensorflow as tfprint("Num GPUs Available: ",
2020-07-12 18:33:03
40534
3
原创 YoloV3使用k-means聚类产生矛框大小(以VOC数据集为例)
import matplotlib.pyplot as pltimport numpy as npimport os, cv2%matplotlib inlineLABELS = ['aeroplane', 'bicycle', 'bird', 'boat', 'bottle', 'bus', 'car', 'cat', 'chair', 'cow', 'diningtable','dog', 'ho.
2020-07-12 16:06:01
3180
3
原创 目标检测:获得类别信息
from __future__ import absolute_importfrom __future__ import divisionfrom __future__ import print_functionfrom __future__ import unicode_literalsimport osimport sysimport numpy as npfrom .coco_eval import bbox2outimport logginglogger = logging.
2020-07-10 14:43:36
757
原创 目标检测:绘制mask和bbox
from __future__ import absolute_importfrom __future__ import divisionfrom __future__ import print_functionfrom __future__ import unicode_literalsimport numpy as npfrom PIL import Image, ImageDrawfrom .colormap import colormap__all__ = ['visualiz.
2020-07-10 14:39:21
1911
原创 设置颜色图
from __future__ import absolute_importfrom __future__ import divisionfrom __future__ import print_functionfrom __future__ import unicode_literalsimport numpy as npdef colormap(rgb=False): """ Get colormap """ color_list = np.array(.
2020-07-10 14:20:46
438
原创 目标检测:交并比计算和bbox回归操作
from __future__ import absolute_importfrom __future__ import divisionfrom __future__ import print_functionimport loggingimport numpy as npimport paddle.fluid as fluid__all__ = ["bbox_overlaps", "box_to_delta"]logger = logging.getLogger(__name__.
2020-07-10 08:04:22
948
原创 python环境下opencv学习(1)
检测opencv是否安装"""测试opencv是否安装"""# 导入opencvimport cv2#使用函数cv2。imread()读入图像#图像应该在工作目录中,或者提供全路径image = cv2.imread("logo.png")#使用cv2.cvtColor()转变图像格式# In this case we use cv2.cvtColor() to conve...
2020-05-06 09:09:46
262
原创 数字图像处理—学习日记(2):图像直方图及均衡化
基本的图像处理操作交互式标注使用PyLab库ginput()函数进行交互式标注。下面展示代码,脚本首先绘制图像,然后等待用户在图像窗口图像区域点击三次,点击得到的坐标【x, y】自动保存在x列表中。from PIL import Imagefrom pylab imprt *im = array(Image.open('example.jpg'))imshow(im)print...
2020-03-28 10:29:55
390
原创 数字图像处理—学习日记(2):基本的图像操作和处理
使用Matplotlib进行基本图像操作Matplotlib介绍绘制图像、点和线图像轮廓和直方图Matplotlib介绍Matplotlib类库可以进行数字运算,绘制图表,绘制点,直线和曲线等等。绘制图像、点和线用几个点和一条线绘制图像:from PIL import Imagefrom pylab import *#读取图片到数组im = array(Image.open('e...
2020-03-27 21:28:31
395
原创 数字图像处理—学习日记(1):简单的图像读写,转换操作,通过python
1 PIL:python图像处理库(1)PIL最重要的模块为Image,读取一张图像。from PIL import Imagepil_im = Image.open('example.jpg')(2)对读入的图像进行转换,使用Convert()方法pil_im = Image.open('example.jpg').convert(‘L’)2 对图像格式进行转...
2020-03-27 20:52:55
353
原创 人工智能
1.人工智能从1956年诞生至今共经历过三次大的浪潮。第一次:1956年达特茅斯会议之后的十几年是人工智能的第一个黄金时代。代表科学家:约瑟夫·维森班。代表成果:开发了ELIZA,Wabot-1。转入低谷原因:到了70年代后期,由于计算机性能的不足、计算难度的指数级增长以及数据量缺失等问题,人工智能开始遭遇发展瓶颈,人工智能遭遇了发展历史上的第一次低谷。第二次:1982年,随着BP训练算法...
2020-02-20 21:55:20
870
原创 实现简单卷积神经网络实现MNIST手写数据集的识别(python+tensorflow)
#MarkJhon#2019/10/04#homework#????四层卷积神经网络,前两个卷积层由covonlution-relu-maxpool操作组成#1,加载必要的编程库,开始计算图绘画import matplotlib.pyplot as pltimport numpy as npimport tensorflow as tffrom tensorflow.contrib...
2019-10-08 17:32:30
1038
1
原创 图像处理:对图片进行高斯滤波、均值滤波、中值滤波处理
#高斯均值滤波,对原图中的噪声小点进行删除,但是图片会变模糊import cv2import numpy as npimg = cv2.imread('iamge0.jpg', 1)cv2.imshow('src', img)#使用opencvAPI的形式进行调用dst = cv2.GaussianBlur(img, (5,5), 1.5)cv2.imshow('dst', dst...
2019-07-26 16:25:15
2337
1
原创 图像处理:对图片进行彩色直方图均衡化、图片真亮、磨皮美白处理
#实现彩色直方图均衡化import cv2import numpy as npimport matplotlib.pyplot as pltimg = cv2.imread('image0.jpg', 1)cv2.imshow('sec',img)imgInfo = img.shapeheight = imgInfo[0]width = imgInfo[1]count_b ...
2019-07-26 15:13:36
519
原创 图像处理:彩色直方图和灰度直方图实现源码
#彩色直方图源码实现#本质:统计每个像素灰度出现的概率X:0-255, Y:Pimport cv2import numpy as npimport matplotlib.pyplot as pltimg = cv2.imread('image0.jpg',1)imgInfo = img.shapeheight = imgInfo[0]width = imgInfo[1]cou...
2019-07-26 14:30:26
414
原创 图片处理:对图片进行简单修补、对图片灰度直方图进行绘制
#图片修补import cv2import numpy as npimg = cv2.imread('image0.jpg', 1)#通过代码生成损坏的图片#画一个三像素的直线for i in range(200, 300): img[i, 200] = (255,255,255) img[i, 200+1] = (255, 255, 255) img[i, ...
2019-07-26 11:26:49
263
原创 图片处理:对图片进行均衡化处理
#彩色图片直方图import cv2import numpy as np#定义方法,表明直方图的统计def ImageHist(image,type): #定义一个颜色,白色 color = (255, 255, 255) #定义一个windows窗体 windowName = 'Gray' #判断类型 if type == 31: ...
2019-07-26 09:58:18
1107
原创 图片处理:绘制线段,矩形,文字和图片
import cv2import numpy as npnewImageInfo = (500, 500, 3)dst = np.zeros(newImageInfo, np.uint8)#绘制线段,目标图片,起点,终点,绘制线段颜色cv2.line(dst, (100,100),(400,400),(0, 0,255))#绘制另一条,其中20为宽度cv2.line(dst, (...
2019-07-25 21:22:05
192
原创 图片处理:对图片进行浮雕化、颜色效果强化、油画效果处理
#图片浮雕效果import cv2import numpy as npimg = cv2.imread('image0.jpg', 1)imgInfo = img.shapeheight = imgInfo[0]width = imgInfo[1]#进行灰度转化gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)dst = np.zero...
2019-07-25 20:00:03
642
原创 图片处理:图片边缘检测(api调用和源码实现两种方法)
#对图片进行边缘检测,实质:对图片的卷积运算import cv2import numpy as npimport random#实现步骤:1、完成图片灰度处理2、进行高斯滤波,去除噪声干扰3、调用canny完成边缘检测img = cv2.imread('image0.jpg', 1)imgInfo = img.shapeheight = imgInfo[0]width = img...
2019-07-25 16:41:23
1061
原创 图片处理:对图片进行马赛克、毛玻璃、图片融合处理
#对图片指定部位进行马赛克处理import cv2import numpy as npimg = cv2.imread('image0.jpg', 1)imgInfo = img.shapeheight = imgInfo[0]width = imgInfo[1]#定义马赛克窗体范围for m in range(100, 300): for n in range(100,...
2019-07-25 15:57:42
630
原创 图片处理:完成图片的颜色反转
#完成图像的颜色反转#RGB 255-R = newR#灰度图的颜色反转:0-255 255-当前import cv2import numpy as npimg = cv2.imread('image0.jpg',1)imgInfo = img.shapeheight = imgInfo[0]width = imgInfo[1]#转化为灰度图片gray = cv2.cvtC...
2019-07-25 10:14:49
3762
原创 图片处理:完成图片的旋转
#完成图像的旋转import cv2import numpy as npimg = cv2.imread('image0.jpg', 1)imgInfo = img.shapeheight = imgInfo[0]width = imgInfo[1]#定义图像的旋转矩阵,参数1,旋转的中心点,2,旋转的角度,3,缩放的系数matRotate = cv2.getRotationM...
2019-07-25 09:34:25
437
原创 图像处理:完成一幅图像的灰度化处理
#完成图像灰度化的处理import cv2import numpy as np#方法1:读入参数调整去灰度图img0 = cv2.imread('image0.jpg', 0)img1 = cv2.imread('image0.jpg', 1)print(img0.shape)print(img1.shape)#图像展示cv2.imshow('src', img0)cv2.w...
2019-07-25 09:23:06
2269
原创 图像处理:对图片进行缩放
#实现图片缩放#定义一个2*3的矩阵,[[A1 A2 B1],[A3 A4 B2]]#[[A1 A2],[A3 A4]] [B1 B2]#newX = A1*x+A2*y+B1#newY = A3*x+A4*y+B2# x->0.5*x y->0.5*y#把A1=0.5 A2=0 B1=0 => newX= 0.5*ximport cv2import ...
2019-07-24 19:55:22
485
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人