tf.nn.max_pool()-优快云博客

本文深入解析TensorFlow中tf.nn.max_pool函数的使用方法，包括参数解释、形状要求及示例代码，演示不同步长和窗口大小下最大值池化的效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

				版权声明：本文为博主原创文章，转载请注明出处。					https://blog.youkuaiyun.com/mao_xiao_feng/article/details/53453926				</div>
							<link rel="stylesheet" href="https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-f57960eb32.css">
							            <link rel="stylesheet" href="https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-f57960eb32.css">
					<div class="htmledit_views" id="content_views">

max pooling是CNN当中的最大值池化操作，其实用法和卷积很类似

有些地方可以从卷积去参考【TensorFlow】tf.nn.conv2d是怎样实现卷积的？

`tf.nn.max_pool(value, ksize, strides, padding, name=None)`

参数是四个，和卷积很类似：

第一个参数value：需要池化的输入，一般池化层接在卷积层后面，所以输入通常是feature map，依然是[batch, height, width, channels]这样的shape

第二个参数ksize：池化窗口的大小，取一个四维向量，一般是[1, height, width, 1]，因为我们不想在batch和channels上做池化，所以这两个维度设为了1

第三个参数strides：和卷积类似，窗口在每一个维度上滑动的步长，一般也是[1, stride,stride, 1]

第四个参数padding：和卷积类似，可以取'VALID' 或者'SAME'

返回一个Tensor，类型不变，shape仍然是[batch, height, width, channels]这种形式

示例源码：

假设有这样一张图，双通道

第一个通道：

第二个通道：

用程序去做最大值池化：


 
 
   
   
    
    
   
   
   
   
    
    
     
     import tensorflow 
     
     as tf
    
    
   
   

   
   
    
    
   
   
   
   
    
     
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     a=tf.constant([
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
             [[
     
     1.0,
     
     2.0,
     
     3.0,
     
     4.0],
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
             [
     
     5.0,
     
     6.0,
     
     7.0,
     
     8.0],
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
             [
     
     8.0,
     
     7.0,
     
     6.0,
     
     5.0],
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
             [
     
     4.0,
     
     3.0,
     
     2.0,
     
     1.0]],
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
             [[
     
     4.0,
     
     3.0,
     
     2.0,
     
     1.0],
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
              [
     
     8.0,
     
     7.0,
     
     6.0,
     
     5.0],
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
              [
     
     1.0,
     
     2.0,
     
     3.0,
     
     4.0],
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
              [
     
     5.0,
     
     6.0,
     
     7.0,
     
     8.0]]
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
         ])
    
    
   
   

   
   
    
    
   
   
   
   
    
     
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     a=tf.reshape(a,[
     
     1,
     
     4,
     
     4,
     
     2])
    
    
   
   

   
   
    
    
   
   
   
   
    
     
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     pooling=tf.nn.max_pool(a,[
     
     1,
     
     2,
     
     2,
     
     1],[
     
     1,
     
     1,
     
     1,
     
     1],padding=
     
     'VALID')
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     with tf.Session() 
     
     as sess:
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
         print(
     
     "image:")
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
         image=sess.run(a)
    
    
   
   

   
   
    
    
   
   
   
   
    
        
     
     print (image)
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
         print(
     
     "reslut:")
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
         result=sess.run(pooling)
    
    
   
   

   
   
    
    
   
   
   
   
    
        
     
     print (result)

这里步长为1，窗口大小2×2，输出结果：

池化后的图就是：

证明了程序的结果是正确的。

我们还可以改变步长

pooling=tf.nn.max_pool(a,[1,2,2,1],[1,2,2,1],padding='VALID')

最后的result就变成：