cuda中dynamic parallelism中遇到的链接错误:error LNK2001: unresolved external symbol ___fatbinwrap_66_tmpxft_…

本文介绍了CUDA 5.0及以后版本支持的动态并行特性,即可以在核函数内部调用其他核函数,实现递归调用等功能。文中详细说明了使用动态并行所需的软硬件条件,并列举了解决常见问题的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

cuda从5.0版本之后开始支持dynamic parallelism,即可以在__global__函数中调用其他global函数,因此可以实现核函数中再调用核函数。

dynamic parallelism(动态并行)的软硬件条件有:

1. cuda toolKit 版本5.0或以上;

2. GPU compute capability(计算能力)3.5及以上。


此时就可以在核函数中调用另一个核函数了,也可以实现递归调用。

另外会有两个问题:

      1、1227 error : kernel launch from __device__ or __global__ functions requires separate compilation mode

            这是需要开启 generation of relocatable device code ,即在配置属性中设置-rdc=true

      2、出现如下link error:

      无法解析的外部符号 ___fatbinwrap_66_tmpxft_0000176c_00000000_16_cuda_device_runtime_compute_70_cpp1_ii_8b1a5d37,该符号在函数 ___cudaRegisterLinkedBinary_66_tmpxft_0000176c_00000000_16_cuda_device_runtime_compute_70_cpp1_ii_8b1a5d37 中被引用

      这是因为动态并行还需要附加另一个库:cudadevrt.lib。加入即可。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值