CUDA的模板类里不要重载operator=

最新推荐文章于 2025-09-21 09:09:24 发布

转载最新推荐文章于 2025-09-21 09:09:24 发布 · 282 阅读

文章标签：

#python #c/c++ #人工智能

作者遇到在CUDA环境下模板类重载赋值运算符导致的编译错误，通过调试发现nvcc无法确定调用哪个函数，最终解决方案是考虑是否真的需要重载此运算符。

部署运行你感兴趣的模型镜像

苍天啊，这么一个问题折磨了我一天半。本来我有一个模板类：

template 
struct ALIGN16 foo
{
    T x[n];
    foo() {}
    foo(const foo& other) {...}

    void perator=(const foo& other) {...}
};

这个类在C++下没有任何问题，但在CUDA下却报出诡异的错误：

### Assertion failure at line 724 of ../../be/cg/NVISA/exp_loadstore.cxx:
### Compiler Error in file test_carray_gpu.cpp3.i during Code_Expansion phase:
### lda but not addr used?

感觉上，像是nvcc在deduce模板参数时出了问题，无法code expansion了。经过我坚持不懈的折腾，终于被我找到这个stupid的问题，那就是，不能重载operator=，因为我们的拷贝构造函数做了同样的事情，nvcc无法知道该调用那个函数，也可能是，在nvcc里，对象的拷贝和赋值只需要做到内存块的拷贝就可以了。总之，在你想重载operator=的时候，先考虑下，在GPU里，是否内存的直接拷贝就满足了这个需求呢？是否需要重载这个操作符呢？

唉，俺痛苦的一天，还好，没有无功而返。

原文

来自 “ ITPUB博客 ” ，链接：http://blog.itpub.net/22785983/viewspace-619793/，如需转载，请注明出处，否则将追究法律责任。

转载于:http://blog.itpub.net/22785983/viewspace-619793/

您可能感兴趣的与本文相关的镜像