一 基本问题
1.1 Segmentation fault
* 在编译选项中加入 -g -G
* 执行cuda-gdb ./xxx
* 执行run
则会打印对应出错的地方:
1.2 无法打印
1.2.1 打印fp8
15.18. __nv_fp8_e4m3 — CUDA Math API Reference Manual 12.8 documentation
int idx = 1;
printf("A[%d] = %f\n",idx,float(smem_a[0][idx]));
需转换为float类型