
图像处理
文章平均质量分 66
大道@至简
大道至简
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
视觉Transformer(DETR)
CNN backbone 输出特征图展平 : (B,L ,hidden_dim),B为batchsize, L = H*W 特征图大小,hidden_dim特征向量维度。2、将Q,K,V 送入第一个multihead attention 模块,得到第一个多头输出,shape = (B,num_queries ,hidden_dim)分类全连接:(B, N, num_queries,hidden_dim) -> (B, N, num_queries,,而且是一个可学习的。原创 2025-03-06 00:06:51 · 1139 阅读 · 0 评论 -
CUDA各种内存和使用方法
例如:blockSize = 128,一个SM有2048个线程,那么一个SM能同时处理16个block。如果SM有96K的共享内存,每个block则分配96 / 16 = 6K,太大其他block无法获得使用。每个SM的共享内存数量是一定的,也就是说,如果在单个线程块中分配过度的共享内存,将会限制活跃线程束的数量;合适分配单个线程块的共享内存,使得SM的使用率最大化,起到加速的作用。特点:存储只读数据,访问速度快,广播式访问。使用:存储线程块中的共享数据,加速线程间的数据处理。使用:频繁访问的常量数据,原创 2024-12-26 22:18:43 · 1294 阅读 · 0 评论 -
图像筛选去重、去静止
主要使用 structural_similarity 算法判断两张图片的相似度。原创 2024-10-23 17:45:00 · 263 阅读 · 1 评论 -
CV::Mat数据拷贝 memcpy 踩坑
cv::Mat img1(h, w, CV_8UC3);cv::Mat img1(h, w, CV_8UC3, data);一般cv::mat 初始化后数据内存 data 段都是连续的, 可以用isContinuous()函数判断存储是否连续。切记!切记!切记!不连续不能当一维数组处理一般经过裁剪的Mat图像,都不再连续了,如cv::Mat crop_img = src(rect);crop_img 是不连续的Mat图像,如果想转为连续的,最简单的方法,就是将不连续的crop_img 重新clon原创 2022-06-27 15:35:41 · 4372 阅读 · 2 评论 -
Ubuntu opencv 源码编译安装
1.去官网下载opencv, 下载连接http://opencv.org/releases.html,选择sources版本测试unzip opencv-3.4.1.zipsudo apt-get install cmakesudo apt-get install build-essential libgtk2.0-dev libavcodec-dev libavformat-dev libjpeg.dev libtiff4.dev libswscale-dev libjasper-dev安装 l原创 2022-05-26 10:41:56 · 485 阅读 · 0 评论 -
PsROI Pooling 深入理解,附代码
faster rcnn 和 rfcn 的最大不同点在于rfcn采用了PsROI Pooling 保留了局部区域的位置敏感性。输入batch_size = N 的批次训练图像。假设我们通过 RPN 层网络获取了 M 个 rois, 每个 rois 用 1*5 的向量表示,**第0 个数表示rois 所属于的图像id,**对roi 进行pooling 时要到特征图对应的batch 中。例如 rois = [[0, 1,4,6,8],[0,2,3,7,9],[1,3,5,7,9]],有3个roi,其中两个原创 2022-01-18 12:04:59 · 3427 阅读 · 0 评论 -
对抗网络GAN
“adversarial training is the coolest thing since sliced bread" – Yann LeCunGAN 网络主要由生成器G 和 判别器D两大部分组成。G 网络主要用于生成目标,D网络主要用于区分目标。通过二者之间的对抗,使得生成的目标越来越强大。比如我(G)要做亿万富翁,我向一个导师(D)请教:G:我要做亿万富翁D:你学识不够– 于是我开始疯狂学习知识G:我要做亿万富翁D:你投资能力不足– 于是我开始疯狂学习投资G:我要做亿万富翁D原创 2022-01-07 09:43:01 · 277 阅读 · 0 评论 -
FCOS : 一阶段无anchor全卷积检测网络
FCOS: Fully Convolutional One-Stage Object Detection文章链接:https://arxiv.org/pdf/1904.01355.pdfFCOS 是一阶段网络,基于 center-ness 的思想,实现没有anchor, 没有proposal的目标检测。而且召回率不亚于基于anchor 的检测算法。1、网络结构如下:网络结构借用FCN,通过反卷积上采样后进行特征融合,最后获取多尺度的特征输出,文章给出了5层尺度特征feature map, 最后在每一原创 2021-12-14 14:49:48 · 2651 阅读 · 0 评论 -
linux 下 CUDA + Opencv 编程 之 CMakeLists.txt
CMAKE_MINIMUM_REQUIRED(VERSION 2.8)PROJECT(medianFilterGPU)# CUDA packageFIND_PACKAGE(CUDA REQUIRED) INCLUDE(FindCUDA)# CUDA include directoriesINCLUDE_DIRECTORIES(/usr/local/cuda/include)# OpenCV packageFIND_PACKAGE(OpenCV REQUIRED) # OpenCV in原创 2021-09-27 15:35:43 · 506 阅读 · 0 评论 -
CUDA 图像编程
CUDA 图像编程一个 Grid 分成 按维度分成多个Block,个数为 GridDim.x * GridDim.y遍历: blockIdx.x , blockIdx.y一个Block 按维度分成多个Thread,个数为 BlockDim.x * BlockDim.yThread 是最小的运行单元遍历:threadIdx.x , threadIdx.y图像处理中,一个像素对应到一个...原创 2019-12-04 20:57:18 · 1468 阅读 · 0 评论