MLSys
蓝鲸123
做更好的自己
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
winograd 卷积计算加速
论文:https://arxiv.org/pdf/1509.09308.pdf参考腾讯开源的NNCN对winograd的实现,NCNN的开源地址。linux x86上面的实现,主要的入口在convolution_x86.h文件int Convolution_x86::create_pipeline(const Option& opt) {}原创 2020-06-05 16:05:47 · 699 阅读 · 0 评论 -
GPU program
文章目录GPU与CPU的区别CPU与GPU存储程序运行模型thread层面和内存层面参考华盛顿大学[Tianqi Chen的课件]http://dlsys.cs.washington.edu/pdf/lecture5.pdfGPU与CPU的区别上图参考华盛顿大学Tianqi Chen的课件CPU首先ALU的数目少于GPU,并且CPU在Fetch、Decode和Write back的负载是很高的。CPU与GPU存储GPU的L1/SM的存储大于CPU的L1/core的存储。GPU的Share原创 2020-05-29 16:58:30 · 484 阅读 · 0 评论
分享