
Gemmini
文章平均质量分 95
凳子花❀
青州街男子技术学院 && 五道口职业技术学院(深圳分院)[斜眼笑]
致力于免费分享技术,知识,就应该是公开的。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【论文翻译】:A Chipyard Comparison of NVDLA and Gemmini
随着机器学习在日常生活中的广泛应用,机器学习加速器取得了显著发展,性能更加优越,能耗也更为高效。随着大量新型加速器的涌现,有必要在通用基准测试上对它们与最先进的加速器进行衡量和比较。在本项目中,我们首先将开源的NVIDIA深度学习加速器(NVDLA)集成到Chipyard框架中,然后将其与开源的Gemmini systolic阵列生成器进行对比。结果表明,在运行ResNet-50时,NVDLA相比默认配置的Gemmini快2.93倍,相比同等规模配置的Gemmini快3.77倍。原创 2025-07-28 14:21:02 · 650 阅读 · 0 评论 -
【Gemmini系列】【四】在Chipyard生态系统中用Buddy-MLIR为Gemmini加速器进行编译指南
当代计算领域正面临一个根本性的转折点。一方面,摩尔定律的经济和物理效益逐渐减弱,依赖通用处理器性能提升的传统模式已难以为继。另一方面,深度学习等计算密集型应用的需求呈爆炸式增长,对算力提出了前所未有的要求。这一矛盾催生了计算架构的范式转变:从通用计算转向专用计算,领域特定加速器(Domain-Specific Accelerators, DSAs)应运而生。然而,设计高效的DSA硬件只是挑战的一部分,如何为其高效、便捷地编程,是更为严峻的难题。高级机器学习框架(如PyTorch、TensorFlow)在抽象原创 2025-07-03 16:47:13 · 638 阅读 · 0 评论 -
【Gemmini系列】【三】对Gemmini脉动阵列加速器的架构深度解析
为了全面理解Gemmini加速器的设计理念,必须首先将其置于其运行的宏观环境——一个完整的片上系统(SoC)中进行考量。与许多独立的外设加速器不同,Gemmini的设计与主机系统紧密集成,其性能和可编程性与主机CPU及其内存系统深度耦合。该图表所展示的架构,正是这种紧密耦合设计哲学的物理体现。原创 2025-07-03 09:17:43 · 972 阅读 · 0 评论 -
【Gemmini系列】【二】Chipyard SoC开发框架及其在先进研究中的应用
在Chipyard中,定义一个SoC的主要方式不是通过修改顶层的Verilog或Chisel代码,而是通过编写和组合配置(Config)类。这是一个极其强大和灵活的机制。定义:一个Config类是一个Scala类,它本质上是一系列设计参数的集合。这些参数直接控制着硬件生成器的行为。组合与覆盖Config类是可组合的。通过使用++操作符,可以将多个Config“片段”(fragments)叠加在一起,形成一个完整的SoC配置。原创 2025-07-03 09:14:55 · 837 阅读 · 0 评论 -
【Gemmini系列】【一】Chipyard文档(版本“HEAD”)
网站类型:技术文档🏅权威机构该页面是Chipyard项目的官方技术文档主页。Chipyard 是一个由伯克利架构研究中心 (Berkeley Architecture Research)开发、美国国家科学基金会 (NSF) 支持的开源硬件开发框架。此文档是学习和使用该框架的核心资源。核心功能与目标Chipyard 是一个用于敏捷设计和评估全系统硬件的框架,专注于片上系统 (SoC)的开发。它整合了一系列开源与商业工具,旨在简化从设计、仿真、原型验证到物理实现的完整流程。框架核心组成与工作流程。原创 2025-07-03 09:10:29 · 774 阅读 · 0 评论