RuntimeError: CUDA error: CUBLAS_STATUS_INVALID_VALUE when calling cublasSgemm( handle, opa, opb, m,

此文为作者在实际跑代码中所遇到的问题,然后尝试了多种方法后找到了一种可行方案,仅供参考。

报错:

RuntimeError: CUDA error: CUBLAS_STATUS_INVALID_VALUE when calling cublasSgemm( handle, opa, opb, m, n, k, &alpha, a, lda, b, ldb, &beta, c, ldc)

报错位置:

q, k, v = F.linear(query, w_q, b_q), F.linear(key, w_k, b_k), F.linear(value, w_v, b_v)

具体原因仍未知,但我打印出了 query,w_q,b_q 这些量的形状,已确保是正确的,但仍不行。

解决方法:

尝试使用 torch.matmul 手动实现这个线性变换操作

q = torch.matmul(query, w_q) + b_q  # 对应 F.linear
k = torch.matmul(key, w_k) + b_k
v = torch.matmul(value, w_v) + b_v

可行!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值