
计算机视觉
文章平均质量分 69
莫余
无论如何,都要去试一试,哪怕不能证明我可以!
展开
-
【图像评价指标】PSNR LPIPS LMD SSIM FID
LMD(Landmark Distance)是用于评估面部图像生成质量的指标,它用于度量生成的面部图像与真实面部图像之间的面部特征点的距离,以评估生成图像的面部特征的准确性。LMD通常用于人脸合成和生成任务中,以衡量生成的面部图像与真实面部图像之间的相似性。请注意,实际应用中,需要使用真实图像和生成图像的特征向量来进行计算,通常可以使用深度学习框架(如PyTorch或TensorFlow)中的预训练模型来提取这些特征向量。LPIPS模型的具体架构和参数是经过大规模训练得到的,用于捕捉图像的感知信息。原创 2023-09-28 09:05:34 · 4117 阅读 · 2 评论 -
解决报错:CUBLAS_STATUS_INVALID_VALUE when calling `cublasSgemmStridedBatched( handle, opa, opb, m......
以指定特定路径,取消设置后,系统将不再搜索该路径中的共享库。确保您的系统仍然能够找到所需的共享库文件,否则可能会导致应用程序无法正常工作。环境变量的值删除,这意味着系统将使用默认的库搜索路径来查找共享库文件。用于指定共享库文件(例如动态链接库)的搜索路径。通过设置这个环境变量,您可以告诉系统在哪里查找共享库,以便在运行时加载它们。很多是由于nn.Linner层的 Tensor 尺寸匹配问题,打印下张量的维shape属性,显然我的尺寸也是符合乘法操作的。后,您的系统将使用默认的共享库搜索路径。原创 2023-09-26 14:10:28 · 5603 阅读 · 7 评论 -
FFmpeg使用GPU加速
在执行下面的操作之前,确保以下情况:nvcc -V。原创 2023-07-13 09:53:33 · 4788 阅读 · 3 评论 -
【FFmpeg】一篇文章快速上手 FFmpeg
将最后一个图像的叠加输出流(stream${IMAGE_COUNT}overlaid)与之前所有连接过渡帧的输出流连接起来,用于拼接所有的视频片段。在这个脚本中,-filter_complex 参数后面的内容将用于定义一系列的滤镜操作,包括图像的缩放、裁剪、设置帧率等。循环遍历了每个图像的模糊图像和缩放后的图像,并使用 overlay 过滤器将它们叠加在一起。通过这个循环,为每对相邻的图像创建了连接它们的输入流,用于拼接它们之间的视频片段。在这一部分,对预处理的模糊图像和缩放后的图像进行叠加操作。原创 2023-06-05 10:06:38 · 1375 阅读 · 0 评论 -
【Stable Diffusion WebUI】一篇文章教你如何安装和使用Stable Diffusion WebUI
如果你发现你pip install 安装成功了,但是仍旧卡住,这是因为安装的第三方库和。将一张图片拖过来,右边自动生成 Tag 标签,可帮助我们进行prompt的编写。其实,安装 stable-diffusion-webui 时,会自动创建一个。文件夹,运行stable-diffusion-webui 时所运行的环境就是。,一直重复上述过程,直到bash webui.sh运行结束。将一张图片拖过来,右边自动生成图片的信息,然后点击。的版本不一样导致的,需需要将版本号全部删除掉。,第二次卡住一般是在。原创 2023-05-21 13:59:39 · 3234 阅读 · 0 评论 -
【AIGC】深入理解 LORA模型
LORA模型是一种神经网络模型,它通过学习可以自动调整神经网络中各层之间的权重,以提高模型的性能。本文将深入探讨LORA模型的原理、应用场景、优缺点等方面。原创 2023-05-08 10:18:46 · 22124 阅读 · 3 评论 -
【DarkLabel】使用教程(标注MOT数据集)
Open video第 2 处的内容为数据集类型。例如:VOC、COCO、MOT、YOLO等。第 3 处的内容为标签名称。可在中修改。第 4 处的内容为两种跟踪方法可选:插值法,每次一个目标。首先在第一帧点击Begin Interpolation,然后画目标bbox,按↓键往后几十帧,在找到该目标画出bbox,点击End Interpolation,然后就可以看到中间帧该目标都被圈住了,效果挺好的。原创 2023-05-02 17:28:09 · 7667 阅读 · 7 评论 -
【Segment Anything】CV的大模型Segment Anything也来了,强人工智能的时代究竟还有多远?
我自己上传了一张图片,结果还是挺好的(我上传的图片比较简单)。由于自己的3090显存有限,无法使用。论文解读后续更新……原创 2023-04-06 20:11:06 · 2987 阅读 · 5 评论 -
【合集】Transformer 在目标检测领域的应用(持续更新 ing)
【合集】Transformer 在目标检测领域的应用(持续更新 ing)原创 2023-03-21 18:23:16 · 672 阅读 · 0 评论 -
【目标检测 DeformableDETR】通俗理解 DEFORMABLE TRANSFORMERS FOR END-TO-END OBJECT DETECTION,值得一看。
【目标检测 DeformableDETR】DEFORMABLE TRANSFORMERS FOR END-TO-END OBJECT DETECTION原创 2023-03-19 07:34:37 · 2360 阅读 · 2 评论 -
【目标检测 DETR】通俗理解 End-to-End Object Detection with Transformers,值得一品。
【目标检测 DETR】通俗理解 End-to-End Object Detection with Transformers,值得一品。原创 2023-03-08 08:44:31 · 4598 阅读 · 1 评论 -
【数据集转换】DarkLabel 制作的目标跟踪数据集 转换为 coco格式
【数据集转换】DarkLabel 制作的目标跟踪数据集 转换为 coco格式原创 2023-02-26 13:23:12 · 1489 阅读 · 0 评论 -
【超分顶会详解+部署】ESRT:Transformer for Single Image Super-Resolution
【超分顶会详解+部署】ESRT:Transformer for Single Image Super-Resolution原创 2023-02-22 08:23:23 · 3817 阅读 · 5 评论 -
图像中的异构噪声及评价指标
图像中的异构噪声及评价指标原创 2023-02-19 13:53:10 · 554 阅读 · 0 评论 -
visdrone数据集转化为MOT数据集(用作MOTR模型训练)
visdrone数据集转化为MOT数据集(用作MOTR模型训练)原创 2023-01-02 17:35:46 · 2859 阅读 · 5 评论 -
UAVDT数据集转化为MOT数据集(用作MOTR模型训练)
UAVDT数据集转化为MOT数据集(用作MOTR模型训练)原创 2022-12-07 16:24:22 · 3202 阅读 · 3 评论 -
visdrone2019转化为coco格式数据集(包含DET和VID)
计算机视觉——数据格式转换,将Visdrone2019中的DET(可用来做目标检测)和VID(用来做视频目标检测和跟踪)。原创 2022-10-24 19:51:53 · 5404 阅读 · 4 评论 -
【YOLOv7】使用 YOLOv7 做目标检测 (使用自己的数据集 + 图解超详细)
使用 YOLOv7 做目标检测 (使用自己的数据集 + 图解超详细)原创 2022-09-18 22:47:25 · 6086 阅读 · 10 评论 -
【SwinTransformer】大杀四方的 Swin Transformer 详解及改进
大杀四方的 Swin Transformer 详解及改进原创 2022-07-09 21:33:37 · 5630 阅读 · 7 评论 -
【Swin Transformer】Win10使用Swin Transformer做语义分割 (使用自己的数据集 + 图解超详细)
【Swin Transformer】Win10使用Swin Transformer做语义分割 (使用自己的数据集 + 图解超详细)原创 2022-05-30 10:06:02 · 3888 阅读 · 1 评论 -
【Swin Transformer】Win10使用Swin Transformer做目标检测 (使用自己的数据集 + 图解超详细)
mmcv安装https://github.com/open-mmlab/mmcv测试代码python demo/image_demo.py demo/demo.jpg configs/swin/mask_rcnn_swin_tiny_patch4_window7_mstrain_480-800_adamw_3x_coco.py mask_rcnn_swin_tiny_patch4_window7.pth原创 2022-04-13 09:43:08 · 9875 阅读 · 11 评论 -
【Attention机制】YOLOX模型改进之(SE模块、ECA模块、CBAM模块)的添加
YOLOX模型改进论文地址:https://arxiv.org/pdf/1709.01507.pdf官方代码地址:https://github.com/hujie-frank/SENetPytorch代码地址:https://github.com/moskomule/senet.pytorchSE模块显式地建模特征通道之间的相互依赖关系,通过采用了一种全新的“特征重标原创 2022-02-24 15:14:23 · 14241 阅读 · 26 评论 -
解决报错:Could not get EGL display connection GStreamer-WARNING **: 14:43:51.245: Failed to load plugin
解决报错:Could not get EGL display connection GStreamer-WARNING **: 14:43:51.245: Failed to load plugin原创 2022-02-10 08:38:01 · 5961 阅读 · 2 评论 -
NVIDIA TAO 工具包 (TAO Toolkit) 的部署和应用【LDR、LPR】
文章目录NVIDIA TAO 工具包 (TAO Toolkit) 的部署和使用前期准备安装docker-ce安装nvidia-container-toolkit获取NGC帐户和API密钥Tao Toolkit安装Tao Toolkit使用VirtualEnvRapper创建新的virtualenv安装TAO启动程序Python包nvidia-tao运行Tao Toolkit下载Computer Vision examples安装jupyter生成配置文件生成秘钥,打开python解释器路径登录Docker容原创 2022-01-24 17:24:00 · 7892 阅读 · 9 评论 -
图像数据集整理汇总(包含ImageNet、旷视、VOC、COCO等等)
链接:https://pan.baidu.com/s/1t8mQQzXJvxSA8GcCXbNIhA提取码:pys8ImageNet:https://image-net.org/download.php旷视CrowdHuamn数据集:http://www.crowdhuman.org/VOC2007、VOC2012https://pjreddie.com/projects/pascal-voc-dataset-mirror/COCO数据集:http://mscoco.org/SUN数据集原创 2022-01-12 14:36:23 · 2617 阅读 · 0 评论 -
WIN10使用YOLOX训练自己的数据集(图解超详细)
文章目录WIN10使用YOLOX训练自己的数据集(图解超详细)下载YOLOX源码配置环境,修改源码添加权重文件建立VOCdevkit文件夹添加数据集划分训练集和测试集修改 类别 为自己训练样本的 classes修改类别开始训练训练过程中可能出现的报错ModuleNotFoundError: No module named 'yolox'FileNotFoundError: [Errno 2] No such file or directory: 'D:\\XXX\\datasets\\VOCdevkit\\原创 2022-01-12 11:16:29 · 3138 阅读 · 11 评论 -
【YOLO】基于Pytorch实现视频中的各种类型的车流量检测(利用GPU加速)
文章目录车流量检测导言环境要求1.各种类型的车训练得到权重文件车流量检测导言环境要求AnacondaCUDACuDNNYOLOPytorchPycharm1.各种类型的车训练得到权重文件原创 2021-11-27 17:40:35 · 9481 阅读 · 73 评论 -
Python读取/保存图片的3种方式(PIL、matplotlib、cv2)
文章目录Python读取/保存图片的3种方式PIL方式matplotlib方式OpenCV方式总结:Python读取/保存图片的3种方式PIL方式from PIL import ImageI = Image.open('./image.png')print(type(I)) #---><class 'PIL.JpegImagePlugin.JpegImageFile'>print(I.size) #--->(1280, 720)I.show()原创 2021-11-09 15:31:47 · 26070 阅读 · 0 评论 -
PIL.JpegImagePlugin.JpegImageFile与numpy.ndarray格式转换
文章目录PIL.JpegImagePlugin.JpegImageFile与numpy.ndarray格式转换PIL.JpegImagePlugin.JpegImageFile转换成numpy.ndarraynumpy.ndarray转换成PIL.JpegImagePlugin.JpegImageFilePIL.JpegImagePlugin.JpegImageFile与numpy.ndarray格式转换PIL.JpegImagePlugin.JpegImageFile转换成numpy.ndarray原创 2021-11-09 15:10:08 · 6129 阅读 · 3 评论 -
解决使用YOLO训练自己数据时 cannot load image 的错误
文章目录解决使用YOLO训练自己数据时 cannot load image 的错误出现cannnot load image问题可能原因解决方案针对原因一针对原因二如何修改?解决使用YOLO训练自己数据时 cannot load image 的错误出现cannnot load image问题可能原因图片路径不正确文件路径不正确解决方案针对原因一查看路径后修改针对原因二Windows下CRLF表示换行Linux下LF表示换行MAC下CR表示下一行如何修改?步骤一:使原创 2021-10-26 17:18:40 · 2378 阅读 · 0 评论 -
解决VS报错:MSB8020、MSB8036等SDK版本选择的错误
这是由于该项目的SDK版本问题所导致的,需要更新SDK的版本。首先点击项目,然后点击重定目标解决方案。会弹出下面的对话框,直接点击确定即可。原创 2021-10-20 21:23:50 · 923 阅读 · 0 评论 -
解决报错(4种情况):0x00007FF614F73B96 处(位于 XXX.exe 中)引发的异常: Microsoft C++ 异常: cv::Exception,位于内存位置 0x000XXX
产生报错的原因有很多种:Case1: 有关图片路径问题绝对路径、相对路径,以及“ /” 还是“\”的用法,Case2: 坐标值过大问题rect函数:矩形左上角坐标设置的过大,导致内存出问题!Case3: 模式问题改成Debug或者是Release模式试一下Case4: 配置问题连接器未添加opencv_worldXXX.lib 与opencv_worldXXXd.lib...原创 2021-10-04 15:29:46 · 17220 阅读 · 1 评论 -
VS中 Debug模式 和 Release模式的区别(以及在一种模式下运行正常,另一种模式下运行报错的案例)
文章目录Debug模式 和 Release模式的区别本质区别在一种模式下报错,在另一种模式下正常Debug模式 和 Release模式的区别本质区别Debug 通常称为调试版本,它包含调试信息,并且不作任何优化,便于程序员调试程序。Release称为发布版本,它往往是进行了各种优化,使得程序在代码大小和运行速度上都是最优的,以便用户很好地使用。Debug 和 Release 的真正秘密,在于一组编译选项。 Dbug 版本:/MDd /MLd 或 /MTd 使用 Debug runti原创 2021-10-04 15:08:09 · 968 阅读 · 0 评论 -
解决VS2019配置OpenCV环境时找不到Microsoft.Cpp.x64.user问题,亲测有效
文章目录VS2019配置OpenCV环境时找不到Microsoft.Cpp.x64.user问题出现原因解决方法下载MSBuild文件放入环境相关的目录利用VS2019新建一个项目VS2019配置OpenCV环境时找不到Microsoft.Cpp.x64.user问题出现原因这是由于缺少配置文件导致的,因此我将VS2017的MSBuild文件夹直接复制了一份解决方法下载MSBuild文件链接: https://pan.baidu.com/s/15maE7SJgfo1eAtfTweRPqA提取码原创 2021-10-01 10:55:00 · 754 阅读 · 0 评论 -
【图像分割】GrabCut分割
文章目录GrabCut分割基于Graph Cuts分割改进Graph Cuts分割(GrabCut分割)前景/背景的颜色模型GrabCut算法流程完整代码如下GrabCut分割GrabCut是对GraphCuts的改进版,是迭代的Graph Cut。基于Graph Cuts分割Graph Cuts是基于图论的分割方法。第一种普通顶点对应于图像中的每个像素。每两个邻域顶点(对应于图像中每两个邻域像素)的连接就是一条边。另外两个终端顶点,叫S ( source:代表前景)和T(sink:代表背景)。原创 2021-03-08 14:57:44 · 1743 阅读 · 0 评论 -
【特征描述】ORB详解(附python实例代码)
文章目录特征描述 ORBORB特征描述ORB的基本思路AST角点检测的缺点BRIEF的缺点BRIEFORB对BRIEF的改进完整代码如下特征描述 ORBORB 算法创建的特征向量只包含 1 和 0,称为二元特征向量。1 和 0 的顺序会根据特定关键点和其周围的像素区域而变化。该向量表示关键点周围的强度模式,因此多个特征向量可以用来识别更大的区域,甚至图像中的特定对象。ORB 的特点是速度超快,而且在一定程度上不受噪点和图像变换的影响,例如旋转和缩放变换等。ORB特征描述ORB特征基于FAST角点的原创 2021-03-06 09:03:57 · 4936 阅读 · 0 评论 -
【局部特征】SIFT算法描述(附python实例代码)
文章目录局部特征SIFT实质特点尺度空间高斯金字塔高斯金字塔的构建分为两步:SIFT特征计算步骤SIFT——计算高斯差分(DoG)空间DoG函数DoG高斯差分金字塔DoG局部极值检测SIFT——特征点(又叫关键点)方向估计SIFT——计算特征点描述子完整代码如下局部特征SIFT基于尺度空间不变的特征,是用于图像处理领域的一种描述。可在图像中检测出关键点,是一种 局部特征描述子。实质在不同的尺度空间上查找关键点,并计算出关键点的方向。特点具有良好的不变性旋转、尺度缩放、平移、亮度变化对视角原创 2021-03-04 08:57:52 · 954 阅读 · 0 评论 -
解决OpenCV报错(亲测有效):AttributeError: module ‘cv2.cv2‘ has no attribute ‘xfeatures2d‘
报错原因缺少opencv-contrib-python包解决办法pip install opencv-contrib-python这是有报错了,如下:ERROR: Could not install packages due to an EnvironmentError: [WinError 5] 拒绝访问。: 'E:\\Anaconda3\\Lib\\site-packages\\cv2\\cv2.cp38-win_amd64.pyd' Consider using the `--user`原创 2021-03-03 07:41:29 · 1311 阅读 · 0 评论 -
cv2中fftshift()函数
一.实信号情况因为实信号以fs为采样速率的信号在 fs/2处混叠,所以实信号fft的结果中前半部分对应[0, fs/2],后半部分对应[ -fs/2, 0];1)实信号fft的结果前半部分对应[0, fs/2]是正频率的结果,后半部分对应[ -fs/2, 0]是负频率的结果。大于fs/2的部分的频谱实际上是实信号的负频率加fs的结果。故要得到正确的结果,只需将视在频率减去fs即可得到频谱对应的真实负频率;2)如果要让实信号fft的结果与[-fs/2, fs/2]对应,则要fft后fftshift一下即原创 2021-03-02 12:57:18 · 1112 阅读 · 0 评论 -
AttributeError: ‘NoneType‘ object has no attribute ‘shape‘
在使用OpenCV处理图片时,报出了如下的错误AttributeError: 'NoneType' object has no attribute 'shape'问题分析:无法找到从cv2.imread()的图片资源解决方法查看路径是否正确查看路径中是否有中文注意路径中的"/“和”"...原创 2021-03-01 23:02:19 · 316 阅读 · 0 评论