- 博客(1)
- 问答 (3)
- 收藏
- 关注
原创 博客摘录「 NVIDIA NCCL 源码学习(九)- 单机内ncclSend和ncclRecv的过程」2024年7月8日
send将数据从用户指定的sendbuff拷贝到nccl p2p transport的buff,recv将数据从buff拷贝到用户指定的recvbuff,buff在这里其实就是一个fifo,nccl通过head,tail指针来完成对发送和接收过程的协调;这里是不是所有操作原语单机多卡的拷贝原理?
2024-07-08 15:42:59
302
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人