RuntimeError: expected scalar type Half but found Float

最新推荐文章于 2025-05-24 21:21:00 发布

原创最新推荐文章于 2025-05-24 21:21:00 发布 · 9.7k 阅读

12 ·

CC 4.0 BY-SA版权

文章标签：

#python #深度学习 #人工智能

在尝试将CCNet的十字交叉注意力模块移植到YOLOv5的过程中，作者遇到了CUDA和CuPy类型不匹配的问题，导致训练时出现错误。问题出现在torch.bmm()函数的矩阵乘法运算中，由于两个输入数据的类型不同，引发了冲突。为了解决这个问题，作者采取了使用to()方法将数据类型统一为另一数据的类型，从而成功避免了冲突。修复后的代码在验证阶段运行正常。

部署运行你感兴趣的模型镜像

起因：将CCNet的十字交叉注意力模块移植到YOLOv5中。

经过：在注意力模块中，会有较多的矩阵运算，在训练时出现了cuda和cup类型的冲突(另一篇我写的文章)；而在验证时出现了上述错误。

出错的代码如下：

        # [b1*w1, c1, h1] -> [b1, w1, c1, h1] -> [b1, c1, h1, w1]
        out_H = torch.bmm(value_H, att_H.permute(0, 2, 1)).view(b1, w1, -1, h1).permute(0, 2, 3, 1)
        # [b1 * h1, c1, w1] -> [b1, h1, c1, w1] -> [b1, c1, h1, w1]
        out_W = torch.bmm(value_W, att_W.permute(0, 2, 1)).view(b1, h1, -1, w1).permute(0, 2, 1, 3)

出错的位置在torch.bmm()处，在这里进行了一次矩阵乘法运算。由于两个数据的类型不同，因此发生冲突。

解决方案：仍然是用to()方法，修改数据类型为另一个数据的类型。

        # [b1*w1, c1, h1] -> [b1, w1, c1, h1] -> [b1, c1, h1, w1]
        out_H = torch.bmm(value_H, att_H.permute(0, 2, 1).to(value_H.dtype)).view(b1, w1, -1, h1).permute(0, 2, 3, 1)
        # [b1 * h1, c1, w1] -> [b1, h1, c1, w1] -> [b1, c1, h1, w1]
        out_W = torch.bmm(value_W, att_W.permute(0, 2, 1).to(value_W.dtype)).view(b1, h1, -1, w1).permute(0, 2, 1, 3)

您可能感兴趣的与本文相关的镜像