TensorFlow和Keras中的Crop函数

最新推荐文章于 2025-07-16 18:06:57 发布

FesianXu

最新推荐文章于 2025-07-16 18:06:57 发布

阅读量9.8k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： TensorFlow TensorFlow Using Chores 文章标签： TensorFlow

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/LoseInVain/article/details/80488645

TensorFlow 同时被 2 个专栏收录

33 篇文章

订阅专栏

TensorFlow Using Chores

32 篇文章

订阅专栏

本文介绍TensorFlow及Keras中多种图像裁剪方法，包括随机裁剪、中心裁剪等，并详细解析了Keras中Cropping2D层的参数意义及其使用方法。

TensorFlow和Keras中的Crop函数

在计算机视觉算法中，有些需要对图像进行裁剪（crop）操作的，如下图所示：

这里写图片描述
而在TensorFlow和Keras中(针对于TensorFlow版本1.8)，提供了一系列的函数用于crop操作，分别是:

Keras中的

tf.keras.layers.Cropping1D（用于一维信号如语音信号的裁剪）
tf.keras.layers.Cropping2D（二维信号如图像的裁剪，在空间域上进行裁剪，也就是会影响width和height）
tf.keras.layers.Cropping3D（三维数据，也就是时空数据如视频上的裁剪）

TensorFlowsharp中的

tf.image.crop_and_resize （从原图中提取出多个crop后，用双线性插值进行图片的resize到一个crop_size）
tf.image.crop_to_bounding_box（从原图中裁剪出一个大小为[target_width, target_height]的bounding box）
tf.random_crop（在图中随机地裁剪，每个crop大小为size）
tf.image.central_crop（在图片的中心按照原图比例的central_fraction进行裁剪）
tf.image.decode_and_crop_jpeg（传入一个jpeg图片的地址后进行解码并且裁剪）
tf.image.resize_image_with_crop_or_pad（用裁剪或者均匀填充0的方式进行resize图片）

这些方法大同小异，主要想说说的是一开始并没有看懂tf.keras.layers.Cropping2D中的参数的意义，这里贴出来先：

这里写图片描述

其中的主要参数是cropping，可以为一个int；也可以是一个有两个int构成的元组，如(0,0)；也可以是一个由两个元组构成的元组，其中每一个元组都是由两个int构成的，如((1,2),(3,4))

需要注意的是，如最后一个((1,2),(3,4))为例，指的是从图片中，除去原图的从上面看的第1索引之前的所有像素，直到从底下看的第2索引之前的所有像素，从左边算起来的3排像素，直到从右边算起来的4排像素。其参数的意义是这样的。

其实就相当于

return x[:, :, 1:-2, 3:-4]
#  x with the shape of (data_sample_idx, channel, height, width).

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

FesianXu 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。