一、图像基础知识
1.图像基本数据结构
在计算机中, 图像是由一个个像素点组成,像素点就是颜色点,而颜色最简单的方式就是用RGB或RGBA表示 。

RGB

RGB
如果有A通道就表明这个图像可以有透明效果。
R,G,B每个分量一般是用一个字节(8位)来表示,所以图(1)中每个像素大小就是3 * 8=24位图, 而图(2)中每个像素大小是4 * 8=32位。
2.图像y方向正立或倒立
图像是二维数据,数据在内存中只能一维存储,二维转一维有不同的对应方式。比较常见的只有两种方式: 按像素“行排列”从上往下或者从下往上。
如图所示的图像有9个像素点,如果从上往下排列成一维数据是(123456789), 如果是从下往上排列则为(789456123)。
只所以会有这种区别是因为,前一种是以计算机图形学的屏幕坐标系为参考(左上为原点,y轴向下 ),而另后一种是以标准的数学坐标系为参考(左下为原点,y轴向上)。这两个坐标系只是y值不一样,互相转换的公式为:
y2 = height-1-y1
y1,y2分别为像素在两个坐标系中的y坐标,height为图像的高度。


不过好像只有bmp图片格式以及windows下的GDI,GDI+是从下往上排列,其它比如DirectX,OpenGL,Cocoa(NSImage, UIImage),OpenCV等都是从上往下排列。

本文详细介绍了PaddlePaddle2.0中处理图像的基础知识,包括图像的基本数据结构、y方向正立或倒立、RGB排列顺序以及32位对齐的概念。还探讨了常用的Python图像库,如Numpy、CV2、PIL及其各自的特点和常用操作。内容涵盖图像读取、显示、转换和保存等方面。

最低0.47元/天 解锁文章
445

被折叠的 条评论
为什么被折叠?



