- 博客(7)
- 收藏
- 关注
原创 神威-SpMM学习笔记备忘
矩阵乘(GEMM)算法是数学中最基本、最关键的算法,它的性能对许多科学计算、深度学习的问题解决效率至关重要。BCSR是对CSR的一般化和改进,它和CSR的区别在于把原矩阵分成了大小相同的block,block中的空元素则用0填上,于是每一个block都是稠密的,所以val数组会变大一些(需要填充一些0),但是索引却简化了。通过根进程向同一个通信域中的所有进程发送数据,将数据发送缓冲区的数据分割成长度相等的段,然后分段发送数据给每个进程,如果每段包含N个数据,则向进程i发送的段为。
2023-09-05 13:36:46
551
原创 一只苹果风matx工作站的诞生记(一 · 装机篇)
一只苹果风matx工作站的诞生记(一 · 装机篇)〇、短的介绍由于显卡价格居高不下过于持久,正巧偶然发现tesla卡也能进行图形渲染,只不过要借助其他带有视频输出功能的外设来输出,于是tesla m40加上现有的亮机卡GTX 650组合的方案便名正言顺的产生了。不过现在手中的这张华硕tuf b450m主板pcie位置过于奇葩导致槽位和挡板位置无法顺利兼容,便顺带着一并买回了evga的x299 matx版本,以及一颗换了液金的i9-7900x,一步跃升为理想的matx工作站(暖手炉)。一、硬件选择既然
2021-10-24 15:23:00
6100
2
原创 CUDA项目技术报告 RGB2Grey 山东科技大学并行程序设计
Technical Record&Report for CUDA_RGB2Grey ProjectCopyright© workgroup41 All Rights Reserved.Authored by ZLT - Science and Technology of Intelligence交流使用,禁止转载文章目录Technical Record&Report for CUDA_RGB2Grey Project〇. 硬件平台搭建一. 开发环境搭建前置芝士实践过程二、交叉编译前置
2021-06-23 11:03:19
407
原创 典题档案(2020 Winter)
典题档案(2020 Winter)继续填坑,将做过的典题(特别是出错者)列下来,并附链接,以铭其咎。Upd:2020.12 上海站结束,把近期笔记同步上传到博客文章目录典题档案(2020 Winter)天梯赛L3-007 天梯地图C2r5 B (CF1321D)Gym - 101142C CodeCoder and TopForces天梯赛L3-021 神坛天梯赛L2-022 重排链表C1R7 - CF980B Marlin天梯赛L3-007 天梯地图PTA链接最后存的两条路径,一开始装
2020-12-16 19:44:05
108
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人