高性能计算
文章平均质量分 65
小小蚂蚁fcy
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
浅谈AI软件栈及让人搞不清的Runtime
云端AI软件栈分层架构详解:自底向上包含芯片驱动层、资源管理层、计算加速库层、编译器与运行时、框架集成层和云服务层。其中Runtime系统是核心执行引擎,负责设备管理、内存调度、任务并行、通信优化等关键功能,直接影响算力转化效率。行业正朝着统一架构、编译融合、安全增强等方向演进,Runtime的性能优化已成为衡量AI软件栈成熟度的关键指标,优秀实现可带来3倍以上的性能提升。原创 2025-07-17 13:55:50 · 663 阅读 · 0 评论 -
PoCL Runtime开发笔记
使用llvm-nm -g xx.bc命令查看确认,bitcode file中已包含get_core_id和get_cluster_id符号。路径可与opencl built-in function放在一起,如:pocl/lib/kernel/get_cluster_id.c。built-in function完成后,需要修改CMakeList构建文件,将built-in function编入库.以vecadd为例,完成以上步骤后,编译出vecadd.so,为workgroup function.原创 2024-07-30 10:43:34 · 976 阅读 · 0 评论 -
OpenCL 安装ocl-icd
OpenCL 安装ocl-icd原创 2022-12-20 18:49:24 · 1921 阅读 · 0 评论 -
OpenCL事件对象的理解
事件对象可以用来标记命令的执行状态,状态有以下几种:CL QUEUED -﹣表示任务已经进入命令队列。除 user event 外,其它所有事件的初始状态都为 CL QUEUED 。CL SUBMITTED -- user event 的初始状态。对于其他类型的 event ,该状态表示任务命令已经由主机提交给设备。CL RUNNING -﹣表示设备已经开始执行命令。CL COMPLETE -﹣表示命令执行完成。Eror code -﹣错误代码为负整数值,表示命令执行终止。非...原创 2022-04-21 12:06:09 · 356 阅读 · 0 评论 -
什么是异构计算?
不同的架构设计的处理器具有不同的特点,而不同的应用也具有不同的特点,应当为不同特点的应用使用不同的处理器,使用一种处理器架构满足各个不同市场的需求是痴心妄想。为了提高系统的性能,则必须要把应用的特点和处理器的特性相互配合,这就是协同设计。从应用的特点来看,不同的应用具有不同的需求:有的应用需要大量的访问数据;有的应用局部性很好,而有的应用局部性又很差。从不同的处理器的特点来看,不同的处理器适合做不同的事情:如X86 处理器为进行延迟优化,以减少指令的执行延迟为主要设计考量(当然今天的X86 处理器设计中原创 2022-02-14 10:25:32 · 1957 阅读 · 0 评论
分享