编译64位cu文件的设置



作者:朱金灿

来源:http://blog.youkuaiyun.com/clever101

 

         CUDA(ComputeUnified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。cuda的程序就放到cu文件中,NVIDIA有专门的编译器将cu文件编译成obj文件。今天在将一个含cuda程序的cu文件编译成64位程序时出现一个错误:

1>..\..\Intdir\Debug64\cvSift\ProgramCU.cu.obj: fatal error LNK1112: 模块计算机类型“X86”与目标计算机类型“x64”冲突

 

          想到的错误应该是obj文件还是32位的,但是编译的工程已经被设置为64位。因此需要修改cu文件的属性设置,具体如下:

<think>嗯,用户想知道如何用Makefile编译多个CUDA的.cu文件。我之前在资料里看到过相关的引用,比如引用4提到用nvcc直接编译,或者用CMake。但用户现在特别问的是Makefile,所以得集中在Makefile的方法上。 首先,用户可能需要一个基本的Makefile结构,能处理多个.cu文件。引用3中的例子是用nvcc生成动态库,然后链接到主程序。比如,他们有一个libtestcu.so的目标,然后编译C程序时链接这个库。这可能适用于多个.cu文件的情况,但需要调整。 那怎么处理多个.cu文件呢?通常,每个.cu文件可能需要先编译成对象文件(.o),然后链接在一起。比如,对于多个源文件,可以将每个.cu编译成对应的.o,再链接成可执行文件。在Makefile中,可以定义目标文件列表,然后用模式规则来编译每个.cu文件为.o。 需要注意的是,nvcc的编译选项,比如生成共享库需要-shared和-fPIC,但如果是可执行文件可能不需要。另外,CUDA的运行时库需要链接,比如-lcudart,并且可能需要指定库路径,比如-L/usr/local/cuda/lib64,如引用3和4提到的。 还有,用户可能需要处理头文件依赖的问题,所以在Makefile中应该包含头文件的依赖关系,确保修改头文件时重新编译相关源文件。不过,对于CUDA文件,可能需要用nvcc的-M生成依赖关系,但这可能比较复杂,暂时可能先忽略,保持简单。 所以,可能的步骤是:定义源文件列表,生成对应的对象文件,然后链接所有对象文件成可执行文件。同时,设置正确的编译选项和链接选项。 比如,SRCS = file1.cu file2.cu,然后OBJS = $(SRCS:.cu=.o),再定义规则将.cu编译为.o,使用nvcc -c命令。最后,链接这些.o文件,加上CUDA的库路径和库。 另外,清理目标clean也是必要的,删除中间文件和可执行文件。 检查引用中的例子,比如引用3中的例子,他们用nvcc -shared生成动态库,然后主程序链接这个库。用户可能需要的是生成可执行文件,所以可能不需要生成动态库,而是直接链接对象文件。 另外,需要考虑是否使用GPU架构的编译选项,比如-gencode arch=compute_61,code=sm_61,根据实际GPU架构调整,但用户可能需要根据自己硬件修改。 所以,总结一下,Makefile的结构应该包括: 1. 定义变量:编译器NVCC,源文件列表,对象文件列表,可执行文件名,编译选项,链接选项等。 2. 默认目标:生成可执行文件,依赖于对象文件,然后链接。 3. 模式规则:将每个.cu文件编译为.o文件,使用nvcc -c。 4. clean目标:删除生成的文件。 需要注意路径是否正确,比如CUDA的安装路径,库路径是否正确引用,比如/usr/local/cuda/lib64。 可能用户遇到的错误是找不到cudart库,所以链接时需要正确指定-L和-l选项,如引用3中的例子。 所以,最终的Makefile可能类似: 定义变量: NVCC = nvcc SRCS = main.cu kernel.cu utils.cu OBJS = $(SRCS:.cu=.o) EXEC = demo CFLAGS = -gencode arch=compute_61,code=sm_61 LDFLAGS = -lcudart -L/usr/local/cuda/lib64 然后规则: $(EXEC): $(OBJS) $(NVCC) $(OBJS) -o $@ $(LDFLAGS) %.o: %.cu $(NVCC) -c $< -o $@ $(CFLAGS) clean: rm -f $(OBJS) $(EXEC) 这样,用户如果有多个.cu文件,只需在SRCS中添加即可。同时,需要根据实际GPU架构调整-gencode参数。 可能还需要注意,如果.cu文件之间有依赖关系,比如包含头文件,可能需要添加依赖生成规则,但为了简化,暂时先不处理,用户可能需要自行处理。 最后,验证是否正确,比如运行make后生成可执行文件,没有链接错误。 可能的问题还有,是否每个.cu文件都需要单独编译,这里通过模式规则处理,每个.cu生成对应的.o,然后链接所有.o,应该是可行的。</think>### 如何用 Makefile 编译多个 CUDA (.cu) 文件? #### 1. 基本 Makefile 结构 以下是一个支持编译多个 CUDA 文件的 Makefile 示例,包含编译、链接和清理功能: ```makefile # 定义编译器和源文件 NVCC = nvcc SRCS = main.cu kernel.cu utils.cu # 添加所有需要编译的 .cu 文件 OBJS = $(SRCS:.cu=.o) EXEC = cuda_demo # 编译选项(根据 GPU 架构修改) CFLAGS = -gencode arch=compute_61,code=sm_61 # 示例:NVIDIA Pascal 架构 LDFLAGS = -lcudart -L/usr/local/cuda/lib64 # 默认目标:生成可执行文件 $(EXEC): $(OBJS) $(NVCC) $(OBJS) -o $@ $(LDFLAGS) # 将 .cu 文件编译为 .o 文件 %.o: %.cu $(NVCC) -c $< -o $@ $(CFLAGS) # 清理生成的文件 clean: rm -f $(OBJS) $(EXEC) ``` #### 2. 关键步骤说明 1. **多文件编译**:通过模式规则 `%.o: %.cu`,将每个 `.cu` 文件独立编译为 `.o` 文件[^4] 2. **链接阶段**:将所有 `.o` 文件链接为可执行文件,需显式链接 CUDA 运行时库 `-lcudart`[^3] 3. **GPU 架构适配**:通过 `-gencode` 参数指定目标 GPU 的计算能力(如 `compute_61` 对应 NVIDIA GTX 10 系列) #### 3. 验证与执行 ```bash make # 编译 ./cuda_demo # 运行 make clean # 清理 ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

clever101

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值