
高性能计算
文章平均质量分 97
Zhao Dongyu
技术共享,共同成长:)
展开
-
GEMM优化(RISC-V平台)
本项目记录了在riscv平台上优化SGEMM(单精度浮点通用矩阵乘法)的过程。通用矩阵乘(General Matrix Multiplication,简称gemm)是深度学习框架的核心计算单元之一,广泛用于Convolution、Full connection、Matmul等算子实现。原创 2024-02-27 20:30:00 · 2236 阅读 · 0 评论 -
使用C语言实现模型的推理(一)
因此,我打算用low-level的C语言来实现一套推理引擎,目标是:- 【避繁就简】面向微控制处理器,相对简单的神经网络任务- 【寸土寸金】占用内存资源最小( Flash 的 text 段和 data 段)实测比`tflite micro`要小很多- 【大道至简】全部聚焦于模型推理计算,不做一丝丝多余的操作原创 2024-01-19 16:34:09 · 1614 阅读 · 0 评论 -
转置卷积(一) 搞懂转置卷积的计算
最近做了一些转置卷积的部署工作,最开始搞的时候其实有点晕头转向的,总是在用卷积的计算方式反过来理解转置卷积,尤其是padding部分和stride部分,搞得我头更大了。现在也算是了解了具体工作机制以及加速方式,在这里整理总结一下。原创 2023-05-10 21:00:00 · 1904 阅读 · 2 评论