基于高区分度patch的CNN图像分类

最新推荐文章于 2024-08-16 08:57:49 发布

转载最新推荐文章于 2024-08-16 08:57:49 发布 · 1k 阅读

2 ·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/mimandehuanxue/p/8477483.html

文章标签：

#人工智能

针对传统CNN在某些图像分类任务中表现不佳的问题，提出了一种改进算法——Patch-based CNN（PCNN）。该算法通过修改损失函数使网络专注于具有区分性的图像块，从而提高了分类准确性。在人造及CT数据集上均取得良好效果。

该算法是描述一类图像分类问题，它有如下特点：

如图，主动脉弓和心脏，绿色部分相同，而黄色部分不同。传统的CNN算法，区分效果不佳。在Multi-Instance Multi-Stage Deep Learning for Medical Image Recognition这篇文章中，作者针对这种场景提出了解决方法。

训练：将整张片子切分成patches，每个patch的label与整片的label相同，将这些patches放入CNN分类器训练，在反向传播时，通过修改损失函数：每个片子中对自己类别相应最高的patch才会贡献。如下L1是标准CNN的损失函数，L2是PCNN的损失函数：

这样训练出的网络，就会对有区分度的patch敏感，而对无区分度的无感。

在该人造数据集上，PCNN取得了完美的效果

在CT数据集上，也取得了很大提高。

我体会作者设计这个算法的流程是：

一、通用算法在特定数据集上效果不完美，作者思考其中的痛点，并尝试提出新算法来针对性解决。

二、设计一个人造数据集，验证新算法能完美解决这个痛点。

三、最终虽然对实际数据集有较大提升，但依然不能像人造数据集一样达到完美，是因为实际数据集还有别的痛点。

转载于:https://www.cnblogs.com/mimandehuanxue/p/8477483.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30401605

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【3D 图像分割】基于 Pytorch 的 3D 图像分割9（patch 的 crop 和 merge 操作）

钱多多先森

05-07

4402

3D目标分割任务中的常用操作，patch裁剪和对裁剪后的patch进行组合。尤其是本系列VNet的推理inference阶段，强烈推荐

【patch】CNN中 patch 是什么？patch 在CNN学习训练中是怎么起作用的？

热门推荐

王爷的优快云

07-31

5万+

在阅读基于深度卷积神经网络的图像识别、分类或检测的文献时经常看到“patch”，不是很能理解，后来就总结了一下。通过阅读，“patch”似乎是CNN输入图像的其中一小块，但它究竟是什么呢?当使用CNN解决问题时，“patch”什么时候开始起作用?为什么我们需要“patch”? “patch”和内核(即特征检测器)之间有什么关系? 在CNN学习训练过程中，不是一次来处理一整张图片，而是先...

参与评论您还未登录，请先登录后发表或查看评论

卷积神经网络（CNN）的训练过程（Training）

huayangshiboqi的博客

11-06

1万+

在初识神经网络（初识卷积神经网络CNN）篇，对卷积神经网络有了基本的认识。不过也可以发现一个问题，输入是一张Image，图像信息是确定的；而CNN网络里面也有数据，那这些数据是哪来的？总不能是随便一个数放在CNN网络里，它就可以正常识别；想要CNN网络进行正确的识别工作，CNN网络中的数据（weights）是需要事先训练的；那怎么训练这些数据，才能让CNN网络正常工作呢？这里举一个简单的神经网络进行说明如何训练CNN网络中的数据（weights）： 1 定义基础的神经网络模型：

Patcher：用于精确医学图像分割的混合专家patch Transformers

qq_45745941的博客

05-30

1504

提出了一种新的编码器-解码器视觉转换器架构，Patcher，用于医学图像分割与标准的视觉Transformers 不同，它采用了Patcher块，将图像分割成大的补丁，每个补丁又被进一步划分成小的补丁Transformers 被应用于大Patch 中的小Patch ，这限制了每个像素的感受野使大的Patch 重叠，以增强Patch 内的通信编码器采用具有增加感受野的Patcher块级联来提取从局部到全局水平的特征。

patch-wise分类

weixin_42600128的博客

02-01

481

Patch-wise分类是指将图像分为许多小的子区域(称为patch)，并对每个patch进行单独的分类。这种方法通常用于对大型图像进行分类，并且具有较高的计算效率。它可以在识别图像中的对象和场景方面取得较好的效果。 ...

郑州二七某地产广场大商业高区支模施工方案.docx

03-08

赢顺云指标公式源码文华财经指标高区低区平衡突破.doc

08-11

本文档主要介绍了一种基于文华财经软件的自定义技术分析指标，该指标用于识别股票或期货市场的高区和低区的平衡突破情况，从而帮助交易者判断买卖时机。指标的核心在于运用ZIGZAG函数来追踪价格的波动，结合收盘价、...

万科·钻石广场LOFT产品概念提炼暨高区推广思考.pdf

11-28

【万科·钻石广场LOFT产品概念提炼暨高区推广思考】在房地产市场中，LOFT产品因其独特的设计和多功能性，越来越受到投资者和自用者的青睐。万科·钻石广场的LOFT产品，作为紧随写字楼之后的重要销售点，其概念提炼...

基于深度学习的共享单车预测与调度解决方案.zip

12-28

CNN擅长处理图像数据，例如地理画像，它可以捕捉地理区域的特征，如人口密度、商业区、住宅区等。RNN则适用于处理序列数据，如时间序列，它能够捕获数据随时间变化的动态关系。有时，将这两种网络结合，形成卷积循环...

深度学习中的图像分割：方法和应用

AI公园

11-25

1万+

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：missinglink.ai编译：ronghuaiyang导读介绍使图像分割的方法，包括传统方法和深度学习方法，以及应用场...

对分割好的图像提取patch

11-12

提取分割好的图像的patch块。 %该函数输入由带数据切片叠成的三维矩阵file_data（由函数read_raw得到），和想要得到的patch的大小size_patc（如3或者5） %输出保存patch的cell数组patch_data，其每一个单元保存file_data中每个切片的patch柱（由每个patch叠起来的3*3*num_pixel三维数组）

使用Android Studio的9patch来进行切割图片

若先设计

09-09

1808

1）打开9patch 在你Android SDK 路径下 X:/android sdk/tools ,你会找到一个【draw9patch.bat】,没错这就是9妹啦、官方名 NinePatch ； 2）导入操作文件通过左上角的File文件实现导入一张png图片； 3）对9patch图详细介绍序列 ① ：在拉伸区域周围用红色边框显示可能会对拉伸后的图片产生变形的区域，

patch 卷积神经网络_医学图像分割中使用深度卷积神经网络进行自动目标跟踪

weixin_42149153的博客

01-23

1645

原论文：Erica Rutter, John Lagergren, Kevin Flores. Automated Object Tracing for Biomedical Image Segmentation Using a Deep Convolutional Neural Network. MICCAI 2018.简介卷积神经网络近年来在许多生物医学图像任务中取得了领先的成果。CN...

卷积神经网络CNN

qq_42575457的博客

08-23

655

1、卷积网络仅仅是在其至少一个层中使用卷积代替一般矩阵乘法的神经网络。 2、在卷积网络术语中，卷积的第一个参数（函数x）通常称为输入，第二个参数（函数w）作为内核。输出有时称为特征映射(feature map) 。 3、在机器学习应用中，输入通常是多维数据数组，并且内核通常是由学习算法调整的多维参数数组。我们将这些多维数组称为张量（tensors）。 4、卷积通常对应于非常...

1026学习笔记基于空间patch扩散的方法

m0_37923410的博客

10-27

516

简介 patch是在三维上扩散，深度图融合的方法是在二维图像上。原理：patch贴在物体表面上，我们要做的是扩张patch直到覆盖物体表面，为了保证patch的确是在物体表面的，我们要进行约束：patch的点位于物体表面上，方向与物体切线垂直。论文：参考博客：https://blog.youkuaiyun.com/lhanchao/article/details/51885998?utm_sourc...

ICLR 2023 | PatchDCT: 开启精细化实例分割新篇章！

CV_Autobot的博客

02-24

6613

作者|派派星编辑| CVHub点击下方卡片，关注“自动驾驶之心”公众号ADAS巨卷干货，即可获取点击进入→自动驾驶之心【实例分割】技术交流群后台回复【分割综述】获取语义分割、实例分割、全景分割、弱监督分割等超全学习资料！Title:PatchDCT: Patch Refinement for High Quality Instance SegmentationPaper:https:/...

python 从高分辨图像上抠取图像块

WYXHAHAHA123的博客

05-08

2458

#coding=utf-8 import cv2 import numpy as np import os # 程序实现功能： # 根据patch在高分辨率图像上的索引值，crop出对应区域的图像 # 并验证程序的正确性 ''' 对于当前输入的3328*3328的高分辨率特征图，首先resize到640*640 然后根据当前的patch文件名（包含了patch在高分辨率图像上的行索引和列索引） ...

超高分辨率图像分割项目指南：基于 ultra_high_resolution_segmentation

gitblog_00094的博客

08-16

443

超高分辨率图像分割项目指南：基于 ultra_high_resolution_segmentation 1. 项目目录结构及介绍本项目『超高分辨率图像分割』位于 GitHub ，专为处理超大规模图像分割任务设计。以下为主要目录结构及其简介： ultra_high_resolution_segmentation/ ├── configs # 配置文件夹，包含了模型训练和...

使用多尺度patch合成来做高分辨率的图像复原

AI公园

03-20

2009

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：Chu-Tak Li编译：ronghuaiyang导读从粗到细的进行图像复原，可以实现更高分辨率，更真实的图像复原。在上一篇...

opencv实现图像分段线性变换

最新发布

03-27

<think>嗯，用户想了解如何使用OpenCV实现图像的分段线性变换。首先，我需要回忆一下分段线性变换的基本概念。根据引用[3]，分段线性变换是通过将输入灰度范围分成几个区间，并对每个区间应用不同的线性变换来调整图像的对比度。常见的应用包括对比度拉伸和灰度级分层。接下来，用户提到的是OpenCV的实现方法。根据引用[1]，虽然OpenCV没有直接提供分段线性变换的函数，但可以通过组合基本数学运算和条件语句来实现。可能需要用到cv2.convertScaleAbs、cv2.threshold或者cv2.inRange这样的函数来分段处理像素值。我需要考虑具体的步骤。首先，确定分段点，比如输入灰度范围的分段，比如低对比度区域和高对比度区域。然后，对每个区间应用不同的线性变换系数。例如，在低灰度区域增强对比度，中间区域保持不变，高灰度区域压缩。然后，如何将这些步骤转化为代码呢？可能需要使用NumPy的数组操作来高效处理图像矩阵。例如，使用布尔索引来选择特定灰度区间的像素，并对其应用对应的线性变换。比如，对于输入灰度在[a, b]之间的像素，使用斜率k1和截距b1进行变换，而其他区间可能用不同的斜率。需要注意的是，处理后的像素值可能会超出0-255的范围，因此需要进行截断处理，比如使用np.clip函数。此外，图像的数据类型需要转换为浮点型以进行乘法运算，处理完成后再转换回uint8。现在，参考引用[2]中的C++示例代码，可能需要将其转换为Python代码。例如，使用cv2.LUT函数查找表的方法，预先计算每个灰度值对应的输出值，这样可以提高处理速度。或者，直接逐像素判断并应用变换，虽然效率较低，但对于学习目的更直观。可能需要处理多个分段的情况，比如三段的线性变换。每个分段的斜率和截距不同，需要分别计算。例如，在低段增强对比度，中间段保持不变，高段压缩对比度。具体参数需要用户根据需求调整。最后，验证实现的正确性，可以通过显示变换前后的图像，或者绘制变换函数曲线来确认是否符合预期效果。同时，检查是否存在像素值溢出的问题，并确保处理后的图像正确保存。</think>### 分步说明：OpenCV实现图像分段线性变换 #### 1. **分段线性变换原理** 分段线性变换通过将输入灰度范围划分为多个区间，并对每个区间应用不同的线性变换函数，实现对比度调整。典型形式如下： $$ g(x) = \begin{cases} k_1 \cdot x + b_1 & 0 \leq x < a \\ k_2 \cdot x + b_2 & a \leq x < b \\ k_3 \cdot x + b_3 & b \leq x \leq 255 \end{cases} $$ 其中，$k$为斜率，$b$为截距，控制不同区间的对比度变化[^3]。 --- #### 2. **实现步骤** ##### (1) 定义分段参数假设分段点为$(a, b)$，对应的输出范围为$(c, d)$： - **低灰度区**：输入$[0, a)$，输出$[0, c)$，斜率$k_1 = c/a$ - **中间区**：输入$[a, b)$，输出$[c, d)$，斜率$k_2 = (d-c)/(b-a)$ - **高灰度区**：输入$[b, 255]$，输出$[d, 255]$，斜率$k_3 = (255-d)/(255-b)$ ##### (2) 使用NumPy实现分段处理 ```python import cv2 import numpy as np def piecewise_linear_transform(image, a, c, b, d): # 转换为浮点型避免溢出 img_float = image.astype(np.float32) output = np.zeros_like(img_float) # 分段处理 mask_low = (img_float < a) mask_mid = (img_float >= a) & (img_float < b) mask_high = (img_float >= b) # 低灰度区：k1 = c/a output[mask_low] = (c / a) * img_float[mask_low] # 中间区：k2 = (d-c)/(b-a) output[mask_mid] = ((d - c) / (b - a)) * (img_float[mask_mid] - a) + c # 高灰度区：k3 = (255-d)/(255-b) output[mask_high] = ((255 - d) / (255 - b)) * (img_float[mask_high] - b) + d # 截断到[0, 255]并转换回uint8 return np.clip(output, 0, 255).astype(np.uint8) # 示例：增强低对比度区域（a=100→c=50，b=200→d=200） image = cv2.imread("input.jpg", cv2.IMREAD_GRAYSCALE) result = piecewise_linear_transform(image, a=100, c=50, b=200, d=200) cv2.imwrite("output.jpg", result) ``` ##### (3) 效果验证 - **输入输出曲线**：绘制变换前后的灰度值映射关系（横轴为输入，纵轴为输出） - **直方图对比**：使用`cv2.calcHist`观察对比度变化 --- #### 3. **优化方法** - **查找表加速**：预先计算所有灰度值的映射关系，使用`cv2.LUT`加速： ```python def build_lut(a, c, b, d): lut = np.zeros(256, dtype=np.uint8) # 低区 lut[:a] = np.clip((c / a) * np.arange(a), 0, 255) # 中区 x_mid = np.arange(a, b) lut[a:b] = ((d - c) / (b - a)) * (x_mid - a) + c # 高区 x_high = np.arange(b, 256) lut[b:] = ((255 - d) / (255 - b)) * (x_high - b) + d return lut.astype(np.uint8) lut = build_lut(100, 50, 200, 200) result = cv2.LUT(image, lut) ``` --- #### 4. **应用场景** - **医学影像增强**：突出特定灰度范围的细节[^1] - **工业检测**：增强缺陷区域的对比度[^2] - **低光照图像修复**：拉伸暗区亮度，压缩过曝区域 ---