- 博客(17)
- 资源 (2)
- 收藏
- 关注
原创 Scala+Chisel教程 | Chisel Bootcamp中文
这是一个很好的 Scala+Chisel 的入门教程,不需要本地配置环境,可以方便的在线运行。项目介绍了 Scala 基础语法(case class、trait、伴生对象)、函数式编程、Chisel 编程和测试,虽然不是很全,但很适合用来上手。,一个基于RISC-V向量扩展的开源的GPGPU软硬件实现。即点即用的 playground,不需要配置环境在。fork的翻译版链接在。使用chisel撰写。
2024-06-23 15:14:21
451
原创 【文献阅读】gem5-gpu: A Heterogeneous CPU-GPU Simulator
gem5-gpu是一个新的模拟器,为紧密集成的CPU-GPU系统建模。它建立在gem5(一个模块化的全系统CPU模拟器)和GPGPU-Sim(一个详细的GPGPU模拟器)的基础上。gem5-gpu通过Ruby路由大多数内存访问,Ruby是gem5中一个高度可配置的内存系统。通过这样做,它能够模拟许多系统配置,从具有连贯缓存和跨越CPU和GPU的单一虚拟地址空间的系统到保持独立的GPU和CPU物理地址空间的系统。应用程序可以启动非阻塞式内核,允许CPU和GPU同时执行。
2022-10-10 23:42:35
2717
原创 【文献阅读】Accel-Sim: An Extensible Simulation Framework for Validated GPU Modeling
Accel-Sim: An Extensible Simulation Framework for Validated GPU Modeling
2022-10-09 19:43:47
1046
原创 【文献阅读】[非线性模块]NPE: An FPGA-based Overlay Processor for Natural Language
近年来,基于Transformer的模型已经显示出自然语言处理(NLP)的最新成果。特别是,BERT语言模型的引入带来了诸如问答和自然语言推理等任务的突破,推进了允许人类与嵌入式设备自然交互的应用程序。基于FPGA的overlayprocessors已被证明是边缘图像和视频处理应用的有效解决方案,这些应用主要依赖于低精度线性矩阵运算。相比之下,基于Transformer的NLP技术采用了各种具有更高频率的更高精度的非线性运算。KeyWords。...
2022-07-18 11:21:33
2675
原创 【文献阅读】An Investigation on Hardware-Aware Vision Transformer Scaling
VisionTransformer(ViT)在各种计算机视觉任务中表现出可观的性能,最近引起了很多研究关注。最近的许多工作都集中在提出新的架构以改进ViT并将其部署到实际应用程序中。然而,很少有人努力分析和理解ViT的架构设计空间及其对不同设备的硬件成本的影响。在这项工作中,通过简单地缩放ViT的深度、宽度、输入大小和其他基本配置,我们表明,与大多数最新的ViT变体相比,没有花里胡哨的ascaledvanillaViTmodel可以实现相当或更高的精度效率权衡。...
2022-07-17 20:28:53
423
原创 【文献阅读】HAT: Hardware-Aware Transformers for Efficient Natural Language Processing
题目HAT,时间2020,研究机构MIT 寒松团队
2022-07-17 20:04:05
165
原创 【文献阅读】MCUNet: Tiny Deep Learning on IoT Devices
一种高效网络架构搜索(TinyNAS)与轻量推理引擎(TinyEngine)联合设计的方案。它可以使得ImageNet级别的推理在微处理器上进行运行。
2022-07-16 01:38:29
595
原创 【文献阅读】VAQF: Fully Automatic Software-Hardware Co-Design Framework for Low-Bit Vision Transformer
VAQF : 低比特Vision Transformer的全自动软硬件协同设计框架
2022-07-14 20:25:03
1121
2
原创 【文献阅读】Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
Swin Transformer
2022-07-14 12:29:47
966
原创 【文献阅读】isl: An Integer Set Library for the Polyhedral Model
题目:isl: An Integer Set Library for the Polyhedral Model时间:2010会议:ICMS (International Congress on Mathematical Software)研究机构:Department of Computer Science, Katholieke Universiteit Leuven, Belgium and Team ALCHEMY, INRIA Saclay, France...
2022-07-10 18:45:18
427
原创 【文献阅读】Multi-state MRAM cells for hardware neuromorphic computing
题目:Multi-state MRAM cells for hardware neuromorphic computing时间:2021会议/期刊:研究机构:AGH University of Science and Technology
2022-07-10 18:43:46
598
原创 【文献阅读】Small-Footprint Keyword Spotting with Multi-Scale Temporal Convolution
题目:Small-Footprint Keyword Spotting with Multi-Scale Temporal Convolution时间:2020会议/期刊:INTERSPEECH研究机构:CAS Key Laboratory of Wireless-Optical Communications, 中科大
2022-07-10 10:02:18
550
原创 【文献阅读】Counting Integer Points in Parametric Polytopes Using Barvinok‘s Rational Functions
题目:Counting Integer Points in Parametric Polytopes Using Barvinok’s Rational Functions时间:2007会议/期刊:Algorithmica
2022-06-20 18:32:39
188
原创 【文献阅读】TENET: A Framework for Modeling Tensor Dataflow Based on Relation-centric Notation
TENET: A Framework for Modeling Tensor Dataflow Based on Relation-centric Notation
2022-06-19 16:44:39
1191
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人