
高性能计算
文章平均质量分 94
Carlos橘子柠檬
在读
展开
-
【高性能计算】TVM使用TE手动优化矩阵乘法算法解析与代码解读
TE 的设计是作为更复杂的算法的基础,可以搜索潜在的优化。本教程提供了一个 TVM 张量表达(TE)工作流程的演练,使用了一个矢量添加和一个矩阵乘法的例子。通过一系列的操作来描述你的计算。描述我们要如何计算使用调度原语。编译到我们想要的目标函数。可以选择保存该函数以便以后加载。原创 2023-02-27 20:40:31 · 1129 阅读 · 1 评论 -
【嵌入式】gcov/lcov/gcovr代码覆盖率交叉编译使用解析
gcov是一个测试代码覆盖率的程序,正确地使用它搭配GCC可以分析、帮助你将代码写得更高效。帮助你优化程序。类似于一个profiling tool,使用gcov或者gprof,可以收集到一些基础的性能统计数据。每一行代码执行的频度每个代码文件中实际被执行到的行数每一个代码块执行使用的时间gcov创建一个logfile叫做 源文件名称.gcxx (这里的源文件名称指的是.c或者.cc文件的文件名),表示的是这个 源文件.c 中每一行所被执行的次数。这些文件可以配合gprof使用。原创 2023-02-08 15:26:27 · 6895 阅读 · 3 评论 -
【高性能计算】内存大小和地址对齐以及异构平台处理手段
解决内存不断变慢问题的一个方法是在更宽的总线上访问内存,而不是一次访问一个字节原创 2023-01-17 16:35:15 · 1514 阅读 · 0 评论 -
【高性能计算】NCNN源码解析笔记
layer->load_model(mb),我们指定layer其实是解析完模型网络结构的具体的layer,比如卷积Convolution,也就是这个调用其实调用的是layer的子类Convolution层的load_model()函数。在modelbin.cpp中load的实现就很简单了,根据多态的load传入不同的参数,声明一维、二维或三维的Mat,然后把从xxx.bin中解析出的数据放入Mat返回回去就行了。benchmark:一些常见模型的模型文件,如mobilenet,resnet,vgg等。原创 2022-09-30 15:41:52 · 1754 阅读 · 1 评论 -
【高性能计算】英特尔oneAPI—英特尔异构统一编程接口初识及其深度学习应用
英特尔oneAPI-英特尔异构统一编程与接口初识1 高性能计算的今天高性能计算(High performance computing,HPC) 通常使用不同的设备、处理器进行计算。HPC的市场增长逾加迅速,在云计算、大数据、AI等领域大放异彩。如今,全球芯片短缺似乎无法避免,而高性能计算需求愈加旺盛,随着深度学习等需要高性能算力的模型快速发展,硬件价格的上涨、计算能力的限制、模型设计的日益发展,让有限的设备发挥高性能的计算能力,成为无法避免的问题与挑战。2 oneAPI的生正逢时one 代表统原创 2022-05-06 19:46:04 · 4590 阅读 · 4 评论