vs2022编译运行cuda编程的cu文件

原创

已于 2025-01-13 14:28:03 修改 · 776 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#c++ #cuda编程 #GPU

于 2025-01-13 13:26:05 首次发布

1、项目 -----> 生成依赖项 -----> 生成自定义，勾选cuda；

2、*.cu文件右键 -----> 属性 -----> 配置属性 -----> 常规 -----> 项类型改为 cuda c/c++;

3、CUDA C/C++ ---->Device ----->Code Generatio改 compute_52,sm_52;compute_75,sm_75；

#include <cuda_runtime.h>
#include <iostream>

// const关键字表明A和B是只读的，不会在函数内部被修改。
// threadIdx.x：这是CUDA内置变量，代表线程在块中的索引（从0开始）。每个线程都有一个唯一的threadIdx.x值。
// blockIdx.x：这是CUDA内置变量，代表块在网格中的索引（从0开始）。每个块都有一个唯一的blockIdx.x值。
// blockDim.x：这是CUDA内置变量，代表块中线程的数量。对于这个例子，blockDim.x被设置为256。
// idx：计算当前线程在整个向量中的位置。通过将线程索引加上块索引乘以块大小，可以确定当前线程需要处理的位置。
__global__ void vector_add(const float* A, const float* B, float* C, int N) {
    // 线程索引：每个线程都有唯一的索引，可通过 threadIdx, blockIdx, 和 blockDim 获取
    int idx = threadIdx.x + blockIdx.x * blockDim.x;
    if (idx < N) {
        C[idx] = A[idx] + B[idx];
    }
}


int main() {
    const int N = 256;
    float h_A[