高性能计算
文章平均质量分 80
BLAS LAPACK UMFPACK
E2MCC
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
A100 MIG 使用说明
A100 MIG原创 2022-06-06 15:43:16 · 6748 阅读 · 0 评论 -
前所未有的详细总结 BLAS (零)
BLAS例程的命名约定原创 2021-10-14 15:11:51 · 653 阅读 · 0 评论 -
详细解析Fast Inverse Square Root
...原创 2021-09-13 17:05:49 · 1438 阅读 · 0 评论 -
ARMv8 NEON 教程(二)
ARMv8 NEON 教程(二)该篇主要以float类型为例,以实际在C语言代码中,使用一个完整的neon的使用顺序,来讲解neon(使用率最高的接口)四、neon变量声明(一切的开始)1. 变量类型总结:变量声明实际上就是neon所能用到的数据类型。见下表:(由于armv8中寄存器是128位,所以数据类型最大不超过128bit)变量类型说明float32_t一个128位寄存器存储1个float类型变量float32x2_t一个128位寄存器存储2个float类型变原创 2021-09-12 23:27:41 · 2254 阅读 · 3 评论 -
ARMv8 NEON 教程(一)
ARMv8 NEON 教程(一)该教程只针对:ARMv8 AArch64(AArch 64 指ARMv8独有的一种执行状态: ARM Architecture 64 bit)一、 快速开始C语言代码: neon_quick_start.c#include <stdio.h>#include <arm_neon.h> //head file for neonint main(int argc, char ** argv){ /*******************原创 2021-09-09 22:31:56 · 2236 阅读 · 0 评论 -
前所未有的详细总结 BLAS(一):GEMM Routine(零)
GEMM原创 2021-09-03 22:27:49 · 2266 阅读 · 1 评论
分享