- 博客(19)
- 资源 (5)
- 收藏
- 关注
原创 PyTorch常用池化操作
对于输入信号的输入通道,提供2维最大池化(max pooling)操作,如果padding不是0,会在输入的每一边添加相应数目0,dilation用于控制内核点之间的距离。对于输入信号的输入通道,提供1维最大池化(max pooling)操作,如果padding不是0,会在输入的每一边添加相应数目0,dilation用于控制内核点之间的距离。默认值是kernel_size。ceil_mode - 如果等于True,计算输出信号大小的时候,会使用向上取整,代替默认的向下取整的操作。
2024-10-21 23:40:12
507
1
原创 PyTorch从零构建网络实现supervisely 发布的人像分割数据集完美教程
能够让初学者只需要学习这一个教程就能够完全掌握图像语义分割的基本功底。
2024-10-17 22:52:31
1417
原创 torch.cat在给定维度上对输入的张量序列进行连接操作
cat结果如下:可以看出行增加,而通道数和列没有任何变化!cat结果如下:可以看出列增加,而通道数和行没有任何变化!cat结果如下:可以看出通道数变化而行列没有任何变化!沿着此维连接张量序列。
2024-10-13 22:57:09
203
原创 卷积神经网络中 Conv1×1 的具体计算过程
可以看到一共有3组卷积核,每组有2个 1×1 卷积核。6. 第2个通道即是用第2组卷积核分别在原数据上进行卷积操作,然后把结果相加,etc.2. 指定的输出通道是3, 所以产生了3组卷积核,每组包含2个 1×1 形状的卷积核。首先,随机创建一个torch张量,其有两个通道,每个通道都是一组 2×2 的数据。1. 原始数据形状是[2,2,2], 即两个通道,每个通道都是一个2×2矩阵。我们发现,只要改变卷积核的数量,我们就可以改变输出的通道数。, 这就是我们输出的第1个通道的值。
2024-09-29 17:31:42
391
原创 windows11 环境下Mamba 环境安装:causal-conv1d和mamba-ssm报错解决办法
Mamba 环境安装:causal-conv1d和mamba-ssm报错解决办法。解决办法:很多时候 CUDA 版本没达到要求,重新安装 CUDA。出现如下图即causal_conv1d-1.1.1安装成功。,更何况一般都没有 root 权限。出现如下图即mamba_ssm安装成功。自己安装的 CUDA 版本。
2024-09-11 16:15:29
1485
原创 基于YOLOv8的医院病人跌倒检测系统的设计与开发
其次,使用LabelImg工具对数据集进行人工标注,在图像上绘制矩形框,并为其指定类别标签,生成PASCAL VOC或YOLO格式的标注文件,为后续的目标检测、分类等任务提供所需的训练数据,如图所示,存储关于图像中对象的标注信息,包含类别ID、中心X坐标、中心Y坐标、边界框宽度和边界框高度,进一步确保数据的质量和准确性。为解决该问题,本文探索了使用基于YOLOv8目标检测模型算法解决上述问题,旨在提高复杂场景下的跌倒检测的真实性和可靠性,使得在医院安全管理和患者护理等领域具有广泛的应用。
2024-05-27 22:18:30
699
原创 基于yolov8的危险区域目标入侵检测与报警系统
可选择打开视频进行入侵检测或者打开摄像头进行实时目标入侵检测,打开视频或者摄像头后点击绘制区域功能绘制要检测的目标区域/危险区域,绘制完区域后点击绘制完成即可进行特定区域/危险区域目前入侵检测。采用智能化监控模式,可以实时检测特定区域(如军事区域、工厂危险区域等)并识别入侵目标,提取其外观特征,跟踪其运动轨迹,并及时预警。实时性较差的问题日渐突出,智能化监控模式成为新的应用研究方向。当前,人工监控预警模式效率低下。
2024-05-26 21:54:45
1155
1
原创 免费PDF压缩工具
虽然有很多软件都可以压缩PDF文件,但是很多我们熟知的PDF编辑软件都需要付费激活才能使用,或者压缩大小不够,只能压缩一点点(如WPS压缩)。该工具提供两种pdf压缩文件选择方法,方法1为单个文件压缩,方法2为批量pdf文件压缩。(1)压缩批量pdf文件可以选择:首页批量处理——>压缩——>批量选择文件——>压缩选项设置——>压缩开始,如下图所示,可以选择不同的压缩程度。(1)压缩单个pdf文件可以选择:打开文件——>选择文件——>文件——>压缩,如下图所示,可以选择不同的压缩程度。
2024-05-05 00:38:02
379
原创 无感知人脸识别考勤系统
本文详细介绍了人脸识别实现的基本原理,并且基于python+pyqt+MySQL开发了人脸识别考勤系统,主要实现了通过图片或者摄像头的方式进行人脸识别、人员信息录入管理以及人脸打卡信息管理等功能。人脸识别功能通过图片或摄像头的方式将识别到的人脸与数据库中录入的人脸信息进行匹配,将匹配到的人员信息显示在软件界面中。人脸图像采集提供了两种方式:一种方式是通过图片进行人脸采集,另一种方式是通过摄像头拍照的方式进行人脸图像采集。人脸信息录入功能主要是依据图片或者摄像头来进行人脸的特征采集以及人员相关信息的录入。
2024-01-14 23:18:13
2286
1
原创 YOLOv8实现热轧带钢表面缺陷目标检测(附代码和数据集)
数据集中images文件存放的是jpg格式的缺陷图片,annatation中存放的是缺陷图片对应的标注为xml格式文件,包括缺陷的类型、位置和大小等信息。在自己创建的data文件夹中,创建data.yaml文件,存放自己的训练集和测试集地址,检测项目类别数,检测项目类别:(对于本数据集共有6中类别,因此nc:6。)(种类名称放到names:)使用YOLOv8进行缺陷检测,需要的数据集格式为txt。(n、s、m、l、x五种不同规模的预训练模型选择一个即可),放到ultralytics-main目录下即可。
2023-12-21 17:47:04
3930
2
原创 Windows安装Yolov8训练、验证、推理自定义数据教程
Windows安装Yolov8训练、验证、推理自定义数据教程。YOLOv8是Ultralytics 2023年的巨作,这是备受赞誉的实时对象检测、图像分类和图像分割模型的最新版本。YOLOv8 建立在深度学习和计算机视觉的前沿进步之上,在速度和准确性方面提供无与伦比的性能。其流线型设计使其适用于各种应用程序,并可轻松适应从边缘设备到云 API 的不同硬件平台。yolov8的推理速度对比如上图,极大的提高了训练速度。官方提供了两种形式的安装方法,这里如果只是玩玩的话建议使用第一种方法安装;
2023-12-12 02:17:09
3533
8
原创 Process finished with exit code -1073740791 (0xC0000409)——pyqt5 运行报错
Process finished with exit code -1073740791 (0xC0000409)
2023-12-10 13:01:42
507
4
原创 windows下完全离线安装Anaconda+Tensorflow
安装结束后需要测试是否成功安装gpu版本的tensorflow,这里依旧在tf250_38gpu环境下输入python,进入python编程环境后输入import tensorflow as tf,下图可见没有报错,说明现在没问题。注意此时可以在Anaconda的安装目录下的envs文件夹下找到刚才创建的tf250_38gpu环境,后续就可以在pycharm中的项目添加此环境。文件加载,需要这个文件的绝对路径,以安装路径D:\tf_whl 为例,输入以下pip安装命令按一下回车就可以等待。
2023-12-06 01:13:55
727
1
原创 pytorch gpu版安装——亲测有效
二、安装torch、torchvision、torchaudio三个组件。并打开需要配置环境的项目,会在右上角提示配置环境,点开配置环境选择。就是输入完一个就按一下回车等待安装完后再进行安装下一个。表示你即将安装的虚拟环境的名字,表示。)版本对应的三个组件,是比较稳妥的。文件加载,需要这三个文件的绝对路径。其他版本修改为对应的版本即可。,我们要去官网查找该版本对应的。安装结束后需要测试是否成功安装。使用已有的环境就可以选择激活的。现在需要依次将之前下载的三个。为例,当然其他版本也适用。
2023-12-03 23:14:52
1768
1
原创 DenseNet121实战二:tensorflow-gpu2.4版本,DenseNet121图像分类任务(猫狗大战)——微调imagenet模型,缩短模型训练时间
DenseNet是CVPR2017的Best Paper,网络的基本思路与ResNet差不多,但是它的不同之处是将前面所有层与后面层的密集连接,目的是实现特征重用。采用kaggle上的猫狗数据集,总共10000张图片,猫和狗分别有5000张,取4000张图片作为训练集,1000张图片作为验证集。每张图片的大小都不同,进行训练的时候需要将所有图片resize到相同的大小(224×224),然后输入到网络进行训练。论文地址:https://arxiv.org/abs/1608.06993。
2023-11-28 21:41:36
1012
原创 DenseNet121实战:tensorflow-gpu2.4版本,DenseNet121图像分类任务(猫狗大战)
DenseNet是CVPR2017的Best Paper,网络的基本思路与ResNet差不多,但是它的不同之处是将前面所有层与后面层的密集连接,目的是实现特征重用。采用kaggle上的猫狗数据集,总共10000张图片,猫和狗分别有5000张,取4000张图片作为训练集,1000张图片作为验证集。每张图片的大小都不同,进行训练的时候需要将所有图片resize到相同的大小(224×224),然后输入到网络进行训练。论文地址:https://arxiv.org/abs/1608.06993。
2023-11-28 15:55:33
689
原创 安装albumentations库报错 ERROR: Could not build wheels for opencv-python-headless which use PEP 517
通过百度,最粗暴的方式就是直接pip安装,效果不佳。后来百度发现可以直接上https://pypi.org/project/opencv-python-headless/#files寻找与自己python版本对应的包,然后离线安装。通过以上步骤成功安装opencv-python-headless,这个方法同样对opencv-python相关库的安装适用。然后直接使用下面的命令行安装albumentations库,就可以正确安装!每个人需要的版本不一样,一般安装不上看报错内容会有提示,直接搜就好。
2023-11-27 22:27:19
605
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人