- 博客(1)
- 资源 (5)
- 收藏
- 关注
原创 vcs syscan gcc uvmc uvm dpi 静态库动态库
vcs虽然看似具有联合编译systemc systemVerilog Verilog VHDL C C++ UVMC 等等的能力,但是真想把这些东西揉到一起不,比想象难多了。
2024-12-12 10:40:47
490
高度灵活和节能的深度神经网络加速器的架构设计
中文翻译:Architecture Design for Highly Flexible and Energy-Efficient Deep Neural Network Accelerators (翻译结果)
这个是我付费翻译的,但是也难免有些许错误。可以先看看摘要的翻译效果。
摘要
深度神经网络(DNNs)是现代人工智能(AI)的支柱。然而,由于其高计算复杂度和多样化的形状和尺寸,能够在广泛的dnn上实现高性能和能源效率的专用加速器对于使AI在现实世界的应用至关重要。为解决这个问题,本文提出Eyeriss,一种用于DNN处理的软硬件架构联合设计,针对性能、能源效率和灵活性进行了优化。Eyeriss具有一种新颖的RowStationary (RS)数据流,可在处理DNN时最小化数据移动,这是性能和能效的瓶颈。RS数据流支持高度并行处理,同时充分利用多级存储层次中的数据重用,以优化任何DNN形状和大小的整体系统能量效率。与现有的其他数据流相比,rs数据流的能量效率提高了1.4到2.5倍。
2022-08-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人