Pytorch之torch.sort()语法、参数和实际应用案例

原创于 2025-07-17 07:39:40 发布 · 646 阅读

18 ·

CC 4.0 BY-SA版权

文章标签：

#pytorch #人工智能 #python

动手学PyTorch深度学习建模与应用专栏收录该内容

158 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

torch.sort 是 PyTorch 中用于对张量进行排序的函数，下面将详细介绍其功能、语法、参数、应用案例以及常见错误与注意事项。
在这里插入图片描述

功能概述

torch.sort 函数用于对输入张量的指定维度进行排序，返回排序后的张量及其对应的索引（即原张量中元素在排序后的位置）。该函数支持升序和降序排列，适用于各种数据类型的张量。

语法和参数

torch.sort(input, dim=-1, descending=False, out=None)

input：必需，待排序的输入张量。
dim：可选，指定排序的维度，默认值为 -1，表示最后一个维度。
descending：可选，布尔值，指定排序方向。True 表示降序，False 表示升序（默认）。
out：可选，用于存储结果的元组（排序后的张量，索引张量）。

返回值

函数返回一个命名元组 (values, indices)，其中：

values：排序后的张量，与输入张量形状相同。
indices：排序后的元素在原张量中的索引位置，称为 argsort。

实际应用案例

1. 对一维张量排序

import torch

x = torch.tensor([3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5])
sorted_values, sorted_indices = torch.sort(x)

print("排序后的值:", sorted_values)
print("排序后的索引:", sorted_indices)

2. 对二维张量按行排序

import torch

x = torch.tensor([[3, 1, 4], [1, 5, 9], [2, 6, 5]])
sorted_values, sorted_indices = torch.sort(x, dim=1)  # 按行排序

print("排序后的值:\n", sorted_values)
print("排序后的索引:\n", sorted_indices)

3. 获取Top-K元素

在推荐系统或图像识别中，常需要获取概率最高的前K个类别：

import torch

# 假设这是模型输出的概率分布
probabilities = torch.tensor([0.1, 0.3, 0.2, 0.5, 0.4])
k = 3  # 获取前3个最大概率值

# 使用降序排序并取前K个
values, indices = torch.sort(probabilities, descending=True)
top_k_values = values[:k]
top_k_indices = indices[:k]

print(f"Top-{k} 值:", top_k_values)
print(f"Top-{k} 索引:", top_k_indices)

4. 对图像特征进行排序

在计算机视觉中，对特征图的每个通道进行排序，可用于特征增强：

import torch

# 假设这是一个图像特征图 [batch_size, channels, height, width]
features = torch.randn(1, 3, 4, 4)

# 对每个通道的特征值进行排序
sorted_features, _ = torch.sort(features.view(1, 3, -1), dim=2)
sorted_features = sorted_features.view(1, 3, 4, 4)

print("排序后的特征图形状:", sorted_features.shape)

5. 多维张量的复杂排序

对多维张量的特定维度进行排序：

import torch

# 创建一个3D张量 [batch, sequence, feature]
x = torch.randn(2, 3, 4)

# 对每个序列的特征向量进行降序排序
sorted_values, sorted_indices = torch.sort(x, dim=2, descending=True)

print("排序后的值形状:", sorted_values.shape)
print("排序后的索引形状:", sorted_indices.shape)

6. 在深度学习模型中使用

在自定义模型中，可以使用 torch.sort 实现特定的层或操作：

import torch
import torch.nn as nn

class SortLayer(nn.Module):
    def __init__(self, dim=-1, descending=False):
        super(SortLayer, self).__init__()
        self.dim = dim
        self.descending = descending
    
    def forward(self, x):
        sorted_values, _ = torch.sort(x, dim=self.dim, descending=self.descending)
        return sorted_values

# 使用示例
model = SortLayer(dim=1)
input_tensor = torch.randn(2, 5)
output = model(input_tensor)

print("输入张量:", input_tensor)
print("输出张量:", output)

常见错误与注意事项

1. 维度索引越界

确保 dim 参数不超过张量的维度范围。例如，对于二维张量，dim 只能是 0 或 1。

2. 内存消耗

对大张量排序可能会消耗大量内存，尤其是在高维情况下。可考虑使用 torch.kthvalue 或 torch.topk 来获取部分排序结果。

3. 稳定性

torch.sort 默认不保证排序的稳定性（即相等元素的相对顺序可能改变）。如果需要稳定排序，可考虑结合其他方法实现。

4. 与 NumPy 的兼容性

如需与 NumPy 交互，可使用 sorted_tensor.numpy() 将结果转换为 NumPy 数组，但需注意张量需在 CPU 上。

5. 性能考虑

排序操作的时间复杂度较高（O(n log n)），在性能敏感的场景中需谨慎使用。

6. 原地操作

PyTorch 还提供了 torch.sort_() 原地操作版本，但不推荐在大多数情况下使用，因为它可能导致梯度计算问题。

通过以上案例和注意事项，你可以灵活运用 torch.sort 处理各种排序需求，并避免常见的错误。
《动手学PyTorch建模与应用:从深度学习到大模型》是一本从零基础上手深度学习和大模型的PyTorch实战指南。全书共11章，前6章涵盖深度学习基础，包括张量运算、神经网络原理、数据预处理及卷积神经网络等；后5章进阶探讨图像、文本、音频建模技术，并结合Transformer架构解析大语言模型的开发实践。书中通过房价预测、图像分类等案例讲解模型构建方法，每章附有动手练习题，帮助读者巩固实战能力。内容兼顾数学原理与工程实现，适配PyTorch框架最新技术发展趋势。
在这里插入图片描述