苍天啊,这么一个问题折磨了我一天半。本来我有一个模板类:
template
struct ALIGN16 foo
{
T x[n];
foo() {}
foo(const foo& other) {...}
void perator=(const foo& other) {...}
};
这个类在C++下没有任何问题,但在CUDA下却报出诡异的错误:
### Assertion failure at line 724 of ../../be/cg/NVISA/exp_loadstore.cxx: ### Compiler Error in file test_carray_gpu.cpp3.i during Code_Expansion phase: ### lda but not addr used?
感觉上,像是nvcc在deduce模板参数时出了问题,无法code expansion了。经过我坚持不懈的折腾,终于被我找到这个stupid的问题,那就是,不能重载operator=,因为我们的拷贝构造函数做了同样的事情,nvcc无法知道该调用那个函数,也可能是,在nvcc里,对象的拷贝和赋值只需要做到内存块的拷贝就可以了。总之,在你想重载operator=的时候,先考虑下,在GPU里,是否内存的直接拷贝就满足了这个需求呢?是否需要重载这个操作符呢?
唉,俺痛苦的一天,还好,没有无功而返。
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/22785983/viewspace-619793/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/22785983/viewspace-619793/
作者遇到在CUDA环境下模板类重载赋值运算符导致的编译错误,通过调试发现nvcc无法确定调用哪个函数,最终解决方案是考虑是否真的需要重载此运算符。
395

被折叠的 条评论
为什么被折叠?



