有些数据集会备注对图像做了如下处理:
Auto-orientation of pixel data (with EXIF-orientation stripping)。
应该如何理解这个处理到底是做了什么呢?
什么是EXIF?
EXIF用来规定除图片内容以外的附加详细信息的一种文件格式,比如图片的属性信息和拍摄数据。
称为可交换图像文件格式(英语:Exchangeable image file format,官方简称Exif)。
Exif可以附加于JPEG、TIFF、RIFF等文件之中,但不支持png,webp等图片格式。
以JPEG为例,我们知道,JPEG是一种对图片进行编码和解码的标准。
但通常,一个JPEG文件不仅包含了图片内容的信息,还包含了该图片的属性信息和拍摄数据,比如图片拍摄地理坐标、时间戳、相机相关信息等。
EXIF规定了上述这些附加信息,应该以何种方式存储于JPEG等文件中。
这也是为何大家顾虑分享手机拍摄的原图会泄露个人隐私。
什么是EXIF orientation?
EXIF orientation是指代图片拍摄时相机的旋转信息。图片浏览器需根据这个参数,将图片自动旋转到正确方向。
为何需要有相机orientation的信息?
因为人们习惯看到的拍摄场景,是符合万有引力的、正向的图片,但相机只负责拍摄场景,并不能理解拍摄内容,所以需要将相机orientation信息记录下来,以便在图片解码时对图片方向进行补偿。
比如,下图中,左边是浏览器自动校正的图片,右边是实际上相机有旋转的拍摄的图片。(图片来源:http://dn-odum9helk.qbox.me/exif.png,http://dn-odum9helk.qbox.me/exif.png?imageMogr2/str