在灰度图一节的最后,给出了一个由彩色图片转成灰度图的示例,并且通过 `color_image.mode`获取了图片的格式:彩色图片获取到的格式为 RGBA,灰度图为L。
这一节介绍一下 RGB 图片以及通道的概念,我个人感觉通道在整个深度学习中很重要,并且极为重要。
举个例子:在很多时候,对神经网络中的一些算法做工程化实现,或者做性能优化,除了关注算法本身之外,还会关注数据存储格式。一般在 pytorch 中,数据存储格式 NCHW, C 指代的就是通道(channel), 如此一来,对于需要在通道维度做归一化(如 reduce)的算法,是很不友好的。
因为数据在通道维度不连续,导致取到完整的通道维度信息要跨越很大的地址范围,CPU 或其他 xPU 对于这类的数据寻址性能都是很差的,至少要比连续寻址差。
以上是举了一个在实际中经常会遇到的一类问题,通道维度数据在存储器中摆放不连续。
当然这一节还不需要深入了解这一些内容,涉及到的内容会在专栏后面有详述,本节只需要了解通道这个概念就行了。
先说下 RGB
彩色通常由红色(Red,R)、绿色(Green, G)、蓝色(Blue, B)三个基本颜色组成,这种颜色表示方式被称为彩色 RGB 模型。
在这个模型中,每个像素的颜色由这三种基本颜色组合而成,因此,一个平面上看似一个像素,实际是由三个不同颜色(不同通道)的像素组成。这里的 R/G/B 三种颜色,就认为是彩色图片的三个通道。
本文介绍了RGB图像和通道的概念,强调通道在深度学习中的关键作用。通过RGB模型,每个像素由红、绿、蓝三个通道组成,影响着颜色的混合。通道在数据存储和神经网络计算中扮演重要角色,尤其是在处理卷积算法时,通道关系对性能有直接影响。了解通道有助于理解特征图的结构和意义。
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



