扩张尺度张量填充方式

最新推荐文章于 2025-12-31 07:49:38 发布

原创最新推荐文章于 2025-12-31 07:49:38 发布 · 438 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #Python #图像特征 #padding

深度学习-计算机视觉专栏收录该内容

8 篇文章

订阅专栏

需求

比如我有一个高分辨率特征张量size为[5,5]，低分辨率特征张量size为[3,3]，如果我想把低分辨率*2然后和高分辨率特征叠加，那就需要把[5,5]和[6,6]的张量加起来，但是维度不一致，怎么把[5,5]的张量通过填充的方式扩展到[6,6]？下面就给出两种填充方式。

一、零填充

1.代码

import torch
import torch.nn.functional as F
import matplotlib.pyplot as plt

# 用 0 填充的函数
def pad_feat_h(feat_h, feat_aggregate):
    # 获取 feat_aggregate 的长和宽
    h_agg, w_agg = feat_aggregate.shape[-2:]
    # 获取 feat_h 的长和宽
    h_h, w_h = feat_h.shape[-2:]

    # 计算 feat_aggregate 长和宽乘 2 的结果
    new_h = h_agg * 2
    new_w = w_agg * 2

    # 判断是否需要进行 padding
    if new_h > h_h or new_w > w_h:
        # 计算需要填充的数量
        pad_h = new_h - h_h
        pad_w = new_w - w_h

        # 计算左右上下需要填充的数量
        pad_left = pad_w // 2
        pad_right = pad_w - pad_left
        pad_top = pad_h // 2
        pad_bottom = pad_h - pad_top

        # 进行 padding 操作
        feat_h = F.pad(feat_h, (pad_left, pad_right, pad_top, pad_bottom), mode='constant', value=0)

    return feat_h

2.测试用例

# 创建一个简单的测试特征图 feat_h
feat_h = torch.tensor([
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
], dtype=torch.float32).unsqueeze(0).unsqueeze(0)  # 添加批次和通道维度

# 创建一个目标特征图 feat_aggregate
feat_aggregate = torch.tensor([
    [0, 0],
    [0, 0]
], dtype=torch.float32).unsqueeze(0).unsqueeze(0)  # 添加批次和通道维度

# 调用填充函数
padded_feat_h = pad_feat_h(feat_h, feat_aggregate)

# 可视化
plt.figure(figsize=(10, 5))

plt.subplot(1, 2, 1)
plt.title("Original feat_h")
plt.imshow(feat_h.squeeze().numpy(), cmap='viridis')
plt.colorbar()

plt.subplot(1, 2, 2)
plt.title("Padded feat_h")
plt.imshow(padded_feat_h.squeeze().numpy(), cmap='viridis')
plt.colorbar()

plt.show()

3.可视化

二、边缘填充

用张量的最外层像素去补齐缺失的元素

1.代码

import torch
import torch.nn.functional as F
import matplotlib.pyplot as plt
import numpy as np

def pad_feat_h_with_edge(feat_h, feat_aggregate):
    # 获取 feat_aggregate 的长和宽
    h_agg, w_agg = feat_aggregate.shape[-2:]
    # 获取 feat_h 的长和宽
    h_h, w_h = feat_h.shape[-2:]

    # 计算 feat_aggregate 长和宽乘 2 的结果
    new_h = h_agg * 2
    new_w = w_agg * 2

    # 判断是否需要进行 padding
    if new_h > h_h or new_w > w_h:
        # 计算需要填充的数量
        pad_h = new_h - h_h
        pad_w = new_w - w_h

        # 计算左右上下需要填充的数量
        pad_left = pad_w // 2
        pad_right = pad_w - pad_left
        pad_top = pad_h // 2
        pad_bottom = pad_h - pad_top

        # 进行 padding 操作，修改 mode 为'replicate'
        feat_h = F.pad(feat_h, (pad_left, pad_right, pad_top, pad_bottom), mode='replicate')

    return feat_h

2.测试用例

# 创建一个简单的测试特征图 feat_h
feat_h = torch.tensor([
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12],
    [13, 14, 15, 16]
], dtype=torch.float32).unsqueeze(0).unsqueeze(0)  # 添加批次和通道维度

# 创建一个目标特征图 feat_aggregate
feat_aggregate = torch.tensor([
    [0, 0, 0],
    [0, 0, 0],
    [0, 0, 0]
], dtype=torch.float32).unsqueeze(0).unsqueeze(0)  # 添加批次和通道维度

# 调用填充函数
padded_feat_h = pad_feat_h_with_edge(feat_h, feat_aggregate)

# 可视化
plt.figure(figsize=(10, 5))

plt.subplot(1, 2, 1)
plt.title("Original feat_h")
plt.imshow(feat_h.squeeze().numpy(), cmap='viridis')
plt.colorbar()