自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 配置gem5环境:Dockerfile使用

Gem5bootcamp的环境配置第一步:dockerfile

2025-05-22 17:39:14 348

原创 集成电路流片随笔26:tinyriscv的三级流水线细则pc

pc_reg模块负责控制指令地址(PC)的更新。复位(Reset)跳转(Jump)流水线暂停(Hold)正常递增条件PC更新为复位 or JTAG复位跳转使能暂停标志 >=Hold_Pc保持不变正常pc_o + 4。

2025-05-09 19:08:58 321

原创 集成电路流片随笔19:full_handshake

该模块实现了通过 JTAG 协议进行数据的接收,并通过握手信号确保接收端和发送端的数据交互可靠。它基于状态机,根据接收到的请求信号来控制接收过程:在 STATE_IDLE状态时,接收端等待接收请求;在 STATE_DEASSERT状态时,接收端确认接收到数据并准备接收下一批数据。同时通过应答信号(ack)向发送端确认数据接收状态,并通过 recv_rdy和 recv_data输出接收到的数据。

2025-04-28 16:39:23 434

原创 集成电路流片随笔18:jtag子模块2

这段代码实现了对 JTAG 接口的调试模块(jtag_dm通过状态机读取和写入 DM 寄存器。

2025-04-21 17:56:23 667

原创 集成电路流片随笔17:jtag子模块1

DTM Debug Transport Module 是 JTAG 调试协议中的一个模块,负责数据传输和调试操作。

2025-04-21 17:55:54 984

原创 集成电路流片随笔16:jtag top下的两个子模块概览 tinyriscv

这个。

2025-04-18 11:26:16 716

原创 集成电路流片随笔15:uart_debug CRC是什么 tinyriscv

define UART_CTRL_REG

2025-04-18 10:11:20 299

原创 集成电路流片随笔14:RIB总线模块和grant仲裁详解tinyriscv

RIB 模块是多个主设备和从设备之间通信的核心组件,确保数据可以无冲突地传输。它负责处理请求、仲裁访问权限、解码地址以及确保每次只有一个主设备可以访问总线。在RIB总线中,有多个“主设备”(master)比如 CPU 取指、CPU 访存、调试器等,它们可能会同时访问总线,为了防止冲突,需要一种仲裁机制决定“本时刻哪个主设备可以控制总线”。这就是grant的作用 ——“授予(grant)某个主设备访问权限”

2025-04-16 12:57:58 1418

原创 集成电路流片随笔13:SPI模块tinyriscv

该模块实现了 SPI 主机的基本功能,包括数据发送 (MOSI),数据接收 (MISO),以及时钟控制 (spi_clk) 和片选 (spi_ss) 信号的生成。通过寄存器控制,用户可以配置 SPI 工作模式、波特率、数据传输等。

2025-04-16 12:57:30 417

原创 集成电路流片随笔12:GPIO模块tinyriscv

【代码】集成电路流片随笔12:GPIO模块tinyriscv。

2025-04-15 17:11:18 241

原创 集成电路流片随笔10:UART模块tinyriscv 通信协议和RIB接口总线区别

UART

2025-04-15 11:16:44 999

原创 集成电路流片随笔9:Timer模块的学习tinyriscv

Timer模块的学习tinyriscv。

2025-04-14 18:00:00 474

原创 集成电路流片随笔8:RAM模块的学习tinyriscv 与ROM类似

这段代码实现了一个简单的、基于地址映射的 RAM 模块。

2025-04-14 13:55:16 425

原创 集成电路流片随笔7:ROM模块的学习tinyriscv

只读存储器实现(ROM)-tinyriscv

2025-04-13 14:00:00 1515

原创 集成电路流片随笔6: SOC_top下tinyriscv的实例化

包括处理器核心、外设(如定时器、UART、GPIO、SPI)和中断控制。

2025-04-13 09:29:42 649

原创 集成电路流片随笔4:define指令的定义

tinyriscv宏定义文件的含义

2025-04-12 11:30:23 893

原创 集成电路流片随笔5: tinyriscvSOC顶层整合所有模块和外设的格式与例化 Verilog

该模块是一个 TinyRISC-V处理器的系统顶层(SoC)设计,连接了多个外设。通过主接口(Master Interface)和从接口(Slave Interface),外设和 CPU 进行数据交换。外设包括JTAG等,所有外设通过总线进行地址解码。每个外设(如timergpiouart等)都通过 addr_i和 data_odata_i信号来进行地址和数据的交换。具体源码见。

2025-04-12 10:22:15 647

原创 集成电路流片随笔3:最简单的流水线中数据读写解读之forwarding

这段 Verilog 代码实现了对寄存器读取时的“前递逻辑”,当检测到读地址 = 正在写的地址时,直接返回写入值,避免流水线的数据冒险问题。附:记不得cpu流水线的可以看一个 CPU 的指令执行过程可以分为多个阶段,不同架构复杂度不同,但以经典的 RISC-V 或 MIPS 五级流水线架构为例,CPU 的执行过程通常分为以下5 个阶段(五段流水线)

2025-04-11 15:43:13 445

原创 Mac OS15 M3pro芯片配置Gem5: X86架构强制docker成功版

MacM芯片配置Gem5 docker buildX86解决方案

2025-04-08 17:49:45 422

原创 MacOS 15+版本iverilog+GtkWAVE

Iverilog+GTKwave macOS15

2025-04-02 18:09:21 266

原创 Openpose摔倒检测数据集

目前摔倒检测我已知有三个数据集:一、UFRD附网址 http://fenix.univ.rzeszow.pl/~mkepski/ds/uf.html简要介绍(+翻译)一下这个数据集:① 来源:热舒夫大学计算建模跨学科中心② 内容:包含 70 个(30 个跌倒 + 40 个日常生活活动)序列。使用 2 个 Microsoft Kinect 摄像头和相应的加速度数据记录跌倒事件。ADL 事件仅使用一台设备(相机 0)和加速度计记录。使用 PS Move (60Hz) 和 x-IMU (256Hz

2024-03-04 10:00:33 1876 1

原创 Understanding Reuse, Performance, and Hardware Cost of DNN Dataflows: A Data-Centric Approach Using

为了利用这些机会,加速器必须调度操作,使PE以协调的方式处理数据张量,这可以看作是应用于图1中卷积的转换(例如,排序和平铺),以及数据到PE的划分。这种调度在先前的工作中被称为数据流,它根据调度最不频繁变化的张量将数据流分类,如权重稳定、输出稳定和输入稳定。图3 给出了一个在4个PE上运行的权重平稳数据流实例。我们可以观察到W1是跨时间的多播(时间多播),I1是跨PEs的多播(空间多播),P3 _ 1是跨空间和时间的缩减。即**实例加速器在时间上复用W1,在空间上复用I1和P3 _ 1。

2024-03-04 09:53:55 1299 1

原创 TeAAL: A Declarative Framework for Modeling Sparse Tensor Accelerators

TOOLS: 遵循Halide【39】提出的模型 目标算法和映射密集张量加速器建模技术无法支持稀疏情况:对不规则稀疏数据进行有效编排和计算时出现了新的复杂性。**OuterSPACE ** 稀疏-稀疏矩阵乘法 (SpMSpM)分成生成、排序和消耗表示部分乘积的链表数组;两个阶段的相同内核,这两个阶段与高基数硬件合并器连接以有效地处理数据;不规则地仅用非零数据填充 PE 数组可以对可在单个深循环嵌套中描述的加速器进行建模,使用抽象分布函数来建模稀疏性,而不是精确建模实际输入集的行为。本文贡献为。

2024-03-04 09:52:41 881 1

原创 CANDLES: Channel-Aware Novel Dataflow-Microarchitecture Co-Design for Low Energy Sparse NNA

目前最先进的稀疏加速器可以描述为。

2024-03-04 09:51:15 1378 1

原创 Griffin:重新思考深度学习架构的稀疏优化 论文自用自学总结

Griffin 一种支持各种 DNN 稀疏性架构进行建模的系统方法。

2023-10-26 12:53:39 342

翻译 LSTM复现(源github)

LSTM 时间序列预测

2022-08-03 17:05:13 2067

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除