
AI加速
文章平均质量分 89
董董灿是个攻城狮
阿里云社区专家博主,AI算法工程师
展开
-
(原创)适合小白的AI算法学习路线
我把上面的技能地图中的内容揉在一起了,因为我们毕竟不像是大学中的课程学习,学C语言就只学C语言,学计算机基础就只学计算机基础,很多东西都是有交集的,一起来学,学的更快,领悟的更深。可以找一个实际的神经网络来练手,将神经网络中的算子都编码实现一遍,到此,100%就可以胜任 AI 算子开发的岗位了,甚至有更多AI的岗位可以选择。需要说明的是,岗位技能的梳理,我默认的学习对象是没有编程经验和AI相关经验的小白,如果你有其中一部分的学习和工作经验,那就太赞了。学完C++进阶,基本上C/C++ 的入门就可以了。原创 2023-07-17 22:57:58 · 2284 阅读 · 0 评论 -
最近一直在做优化
神经网络算子优化原创 2023-02-24 22:51:24 · 598 阅读 · 0 评论 -
神经网络推理加速—— GPU为什么这么牛
游戏,挖矿,深度学习,这三个领域足以让英伟达的GPU傲视群雄!安迪比尔定律,软件会吃掉硬件的性能,反过来会迫使硬件更新迭代!GPU也是如此。GPU独有的多核硬件架构以及专用硬件单元和多层级存储,是GPU傲视群雄的王牌。好啦,本篇文章就说到这,敬请关注本专栏其他文章。本文原创,请勿转载,转载请联系作者欢迎关注@董董灿是个攻城狮及同名公众号。原创 2023-04-15 23:14:12 · 1203 阅读 · 0 评论 -
超简单的卷积和加法融合,伪代码版
超简单的卷积和加法融合,伪代码版原创 2023-03-08 08:12:38 · 1122 阅读 · 0 评论 -
超简单的卷积和加法融合
卷积和加法算法融合优化原创 2023-03-05 20:19:30 · 926 阅读 · 0 评论 -
cast提前!最简单有效的神经网络优化方法,没有之一!
cast提前!最简单有效的神经网络优化方法,没有之一!原创 2023-02-28 19:34:09 · 486 阅读 · 0 评论 -
AI加速(九): 深度理解吞吐量和延时
深刻理解吞吐和延时的区别原创 2022-12-01 19:20:00 · 3019 阅读 · 1 评论 -
AI加速(八)| 循环展开Unrooling——你肯定能学会的程序加速方法
这篇从软件以及AI本身的角度来介绍一些常用的AI加速方法。原创 2022-11-07 19:17:32 · 1626 阅读 · 0 评论 -
AI加速(五)| 一个例子看懂流水——从指令到算法
花了一篇文章来介绍流水和并行技术,是因为并行和流水技术在AI软件的性能优化中占据了很重要的位置。在硬件资源有限的前提下,我们只能通过软件手段来持续进行AI的加速优化。这里面,更深刻的理解硬件的架构,利用好硬件的优势,编写更加硬件友好的软件代码,才能更加有效的实现AI加速。原创 2022-11-07 16:53:27 · 745 阅读 · 0 评论 -
AI加速(七)| 存算一体——冰箱里面炒鸡蛋?
前两天一个同事给我提了个需求,需要开放几个接口给他,我跟他说,这些接口我早就都准备好了,是因为一直没有需求所以没有开放。需求,会推动产品技术的不断迭代。冯诺依曼架构,从二战时期被提出来开始影响世界。但随着近年AI的不断发展,对于计算机性能的要求逐步提高,使得人们不得不尝试打破传统,开始创新,并且从学界开始大规模走向工业界。在如今美国动不动就禁止中国先进芯片工艺的大背景下,存算一体技术,或许也是一条出路,正如中纪委网站上一个关于存算一体公开课上说的那样——原创 2022-10-25 20:35:29 · 745 阅读 · 0 评论 -
AI加速(六)| 异构编程——性能不够,“外挂“来凑?
异构编程可以认为是一种使用专用芯片对神经网络进行加速的外挂方式。通过这种专用的加速卡,来完成神经网络中相关算法的加速运算。其实,异构编程并不是一个很新的概念。据一个从事手机开发的朋友讲,他们很早之前做手机,手机系统中会有很多不同的芯片,主处理器和协处理之间都会有通信,某些算法在主处理器上跑,某些算法在协处理器上跑,最终完成一个整体运算。这就是一种异构编程,只不过当时他们认为这是理所当然的。而随着人工智能的热潮,异构编程这一概念才越来越多的被人所熟知。从而也成为了AI加速中一个不可或缺的编程方式。原创 2022-10-21 23:01:44 · 1553 阅读 · 2 评论 -
AI加速(四)| 衣柜般的分层存储设计
存储器的分层设计,一个好处之一就是,程序员可以通过编写存储指令(包括将数据从外存搬运到内存的 load 指令,将数据从内存加载到片上计算的 move 指令等),从而完成流水的排布。当然,存储器的分层设计肯定不单是这个原因,就不展开了。那么问题来了,这篇文章和AI加速有什么关系呢?其实,存储器作为一个偏计算机底层的部件,是根本不关心上层应用是什么的。我们可以让计算机进行AI计算,来完成AI加速,也可以让计算机运行一个游戏,完成游戏加速。原创 2022-10-17 19:37:23 · 762 阅读 · 0 评论 -
AI加速(三)| 每条指令都是流水线的工人
指令流水线原创 2022-10-15 22:09:31 · 646 阅读 · 0 评论 -
AI加速(二)| 计算机存储和计算的分离
冯诺依曼原创 2022-10-14 13:58:02 · 596 阅读 · 0 评论 -
我准备开始写AI加速系列科普文章了
AI加速原创 2022-09-30 13:48:00 · 729 阅读 · 2 评论 -
今年的人工智能峰会,各位玩家操作亮瞎了
AI芯片峰会直播原创 2022-08-31 19:08:33 · 1117 阅读 · 0 评论 -
AI加速(一)| GPU为什么这么牛?
GPU为什么这么牛原创 2022-07-02 12:34:14 · 2871 阅读 · 0 评论