
python
spectrelwf
这个作者很懒,什么都没留下…
展开
-
语义分割损失函数系列(3):Dice损失
Dice损失在医学图像分割任务中使用得极多,用于度量两个集合得相似性,dice系数的定义如下:DiceCoefficient=2∣A∩B∣∣A∣+∣B∣Dice Coefficient = \frac{2|A\cap B|}{|A| + |B|} DiceCoefficient=∣A∣+∣B∣2∣A∩B∣Dice 损失等于1-dice系数Diceloss=1−DiceCoefficientDice loss = 1-Dice CoefficientDiceloss=1−DiceCoeffic原创 2022-04-14 14:30:09 · 3128 阅读 · 0 评论 -
Pytorch 使用Grad-CAM可视化网络模型的特征图
介绍虽然说咱也不知道这个Grad-CAM的数学理论是如何推导的,但是在看论文的时候发现很多论文里面都用了Grad-CAM来可视化模型的特征图,用来显示网络对ROI区域的捕捉。想详细了解的话看一下B站大佬噼里啪啦的讲解视频。推荐代码code:https://github.com/jacobgil/pytorch-grad-cam安装pytorch-grad-cam :pip install grad-cam官方给的例子:自己的尝试我试着使用这个仓库来可视化我的vit模型,做的是一个五分类的原创 2022-03-23 15:56:00 · 16291 阅读 · 4 评论 -
Pytorch使用Vision Transformer做肺癌和结肠癌组织病理学图像分类
模型介绍文章链接:https://arxiv.org/pdf/2010.11929.pdfgithub地址:视频教程:https://www.bilibili.com/video/BV1Jh411Y7WQ?spm_id_from=333.337.search-card.all.click是B站大佬霹雳吧啦Wz的讲解视频,讲得特别好,我的代码也是完全按照他的代码抄的,自己抄一遍代码对Vision Transformer的理解会更深刻,很多模型细节看论文中是感受不到的,例如embedding的方法。Vis原创 2022-03-22 23:49:57 · 5565 阅读 · 28 评论 -
python读取CIFAR10数据集并将数据集转换为PNG格式存储
CIFAR10数据集介绍CIFAR10数据集包括10类图像,每张图像的大小为32*32,包含如上图的十个类别的对象。每个类都包含6000张图片,总共有60000张图片,数据集平衡。其中,训练组图像包含50000张图片,测试集包含10000张图像。数据集的下载数据集地址:http://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz也可以使用pytorch中的方法来获取数据集:trainset = torchvision.datasets.CIFAR1原创 2021-11-05 14:09:40 · 1610 阅读 · 4 评论 -
使用PYTORCH复现ALEXNET实现猫狗识别
完整代码链接:https://github.com/SPECTRELWF/pytorch-cnn-study网络介绍:Alexnet网络是CV领域最经典的网络结构之一了,在2012年横空出世,并在当年夺下了不少比赛的冠军,下面是Alexnet的网络结构:网络结构较为简单,共有五个卷积层和三个全连接层,原文作者在训练时使用了多卡一起训练,具体细节可以阅读原文得到。Alexnet文章链接:http://www.cs.toronto.edu/~fritz/absps/imagenet.pdf作者在网络原创 2021-11-04 15:34:22 · 2869 阅读 · 1 评论 -
使用PYTORCH复现ALEXNET实现MNIST手写数字识别
网络介绍:Alexnet网络是CV领域最经典的网络结构之一了,在2012年横空出世,并在当年夺下了不少比赛的冠军,下面是Alexnet的网络结构:网络结构较为简单,共有五个卷积层和三个全连接层,原文作者在训练时使用了多卡一起训练,具体细节可以阅读原文得到。Alexnet文章链接:http://www.cs.toronto.edu/~fritz/absps/imagenet.pdf作者在网络中使用了Relu激活函数和Dropout等方法来防止过拟合,更多细节看文章。数据集介绍使用的是MNIST手原创 2021-11-03 19:04:17 · 5677 阅读 · 0 评论 -
MNIST手写数字识别
进入到研究生阶段了,从头学一下Pytorch,在这个小破站上记录一下自己的学习过程。本文使用的是Pytorch来做手写数字的识别。step0:先引入一些相关的包和库import torchfrom torch import nnfrom torch.nn import functional as Ffrom torch import optimimport torchvisionfrom matplotlib import pyplot as pltfrom utils import原创 2021-10-27 20:56:00 · 2583 阅读 · 0 评论 -
python opencv实现目标区域裁剪
这个任务是自己在项目中数据处理的一部分内容,待处理的图片如下所示:我需要将目标区域给裁剪出来,要不然在后期训练网络的时候整幅图像过大,且目标区域过小,得到结果不好,还会加剧计算量。在网上找了各个大佬的博客看,没找到合适的,便自己动手写了,顺便自己的小破站刚搭建起来,记录一下自己的思路。思路去寻找目标区域的最左边,最右边,最上面和最下面的像素点,取到坐标信息以后用CV2的裁剪一下就可以实现了。#难点数据总共是11952张图片,每张图片是1024*768大小的,依次去遍历的话担心太费时间了,结果还好,原创 2021-07-29 21:23:56 · 7182 阅读 · 6 评论 -
python将灰度图转换为RGB彩色图
代码如下:from PIL import Imageimport ospath = r'图片存储的路径'newpath = r'转换后存储图片的路径'def RGBtoGray(path): files = os.listdir(path) for file in files: imgpath = path + '/' + file #print(imgpath) # im = Image.open(imgpat原创 2021-11-12 13:08:45 · 17181 阅读 · 10 评论 -
python将图片转换为灰度图
灰度图的位深度为8,此代码使用PIL库中的convert函数进行转换。convert函数的参数解释:1 ------------------(1位像素,黑白,每字节一个像素存储)L ------------------(8位像素,黑白)P ------------------(8位像素,使用调色板映射到任何其他模式)RGB------------------(3x8位像素,真彩色)RGBA------------------(4x8位像素,带透明度掩模的真彩色)CMYK------------原创 2021-11-12 13:08:59 · 5533 阅读 · 1 评论 -
Windows10环境下使用Anaconda安装tensorflow环境及keras环境
1.打开Anaconda Prompt,以管理员方式运行2.创建名称为Tensorflow的新环境,命令如下conda create --name tensorflow python=3.6这里不用看,输入Y继续安装,然后就是下载一堆的python库3.激活tensorflow虚拟环境activate tensorflow4.安装tensorflow1、先更新pip版本python -m pip install --upgrade pip2、安装pip install te原创 2021-01-02 18:13:28 · 268 阅读 · 2 评论 -
windows10环境下安装Anaconda环境
**windows10安装Anaconda**下载Anaconda可以使用Anaconda官方的下载地址,但是速度比较慢https://www.anaconda.com/推荐使用清华镜像下载Anaconda,速度快版本全,各平台的软件包都有https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/安装AnacondaAnaconda的安装和普通软件一样,一直下一步即可,注意勾选自动添加到环境变量选择安装位置2.将上面的勾选上原创 2021-01-02 17:49:21 · 209 阅读 · 0 评论