
多个cu文件
nvcc -cubin -m64 -lcudadevrt -lcublas_device -gencode arch=compute_35,code=sm_35 -o test.cubin -c test.cu -dlink
You can also do that in two steps:
nvcc -m64 test.cu -gencode arch=compute_35,code=sm_35 -o test.o -dc
nvcc -dlink test.o -arch sm_35 -lcublas_device -lcudadevrt -cubin -o test.cubin
本文介绍使用 NVCC 工具编译 CUDA 代码的方法,包括将源文件编译为对象文件及链接生成最终的 .cubin 文件。通过两步操作实现:首先编译生成对象文件,然后进行链接。
7069

被折叠的 条评论
为什么被折叠?



