自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

月见樽

日隐夜现,潜龙在渊

  • 博客(108)
  • 收藏
  • 关注

原创 public_markdown博客图片自动上传

0.目的为了实现博客的多平台(简书、掘金、知乎等)自动化发布,需要将本地的markdown中的图片自动转为图床链接,尽管已经有PicGO这种神器,但是自动调用PicGo上传图床有以下两个问题本地保留:大量图片为直接从visio中复制过来,如果直接上传本地没有保留副本隐私性:有些笔记不做公开,不希望图片公开因此使用另一种方法解决自动化发布问题,即优先在本地完成文章,设置编辑器为将图片保存...

2021-12-04 18:37:18 438

原创 signaltap内置逻辑分析仪使用记录

0.Signal Tap II 逻辑分析仪Signal Tap II(STP)逻辑分析仪是Altera提供的FPGA内置的逻辑分析仪,可以监控一定范围内的FPGA内部信号。该逻辑分析仪随着RTL代码被写入FPGA中,在quartus继承的软件中可以查看信号变化情况,该逻辑分析仪应用于以下场景:无逻辑分析仪时需要观察片内寄存器时需要观察的时间窗口不长时该逻辑分析仪不适用于以下场景:...

2021-01-19 16:27:52 721

原创 TCP/IP学习笔记1——协议分层

分层概念网络协议是分层的,分层的概念类似于函数封装,不断提供更高级更抽象的接口,最后提供给客户使用。对于分层协议而言,整个协议共同完成一件事情,每个层次基于本层或低层接口完成本层次的功能并对更高级的层次提供接口,即对于每个层次而言,有以下两个主要功能:对高级提供接口:将本层次的功能封装,供高层调用实现本层功能:在本层中实现功能,一般通过调用低层提供的接口实现(最底层除外)举一个例子,若...

2020-09-20 19:21:34 357

原创 高级综合工具StratusHLS学习笔记(4)

HLS中使用浮点数学习目标:使用浮点数换用自己的库进行高级综合HLS中的浮点数stratus HLS提供内置的浮点数,可以实现常规的加减乘操作,类型为:cynw_cm_float<e,f,accurcy,rounding mode,NaN handle>该类型共有5个模板参数,分别如下所示:e:指数位宽,为浮点数的指数位数f:尾数位宽,为浮点数的尾数位数acc...

2020-09-08 16:20:05 849

原创 关于转载与引用

本博客所有文字内容若无特殊标识,均为本人(ID:月见樽)原创完成(图片可能有引用情况,欢迎大家批评指正)。月见樽欢迎大家对博客内容转载和引用,欢迎大家在评论区进行讨论和批评,为数字IC领域的知识传递做一些贡献。但是请所有对月见樽的博客具有引用和转载行为的同学,麻烦您标注引用来源与作者(原文链接与作者名称),可参考以下格式:引用/转载自【原文链接】,作者月见樽希望大家尊重知识,尊重原创作者。月...

2020-07-13 01:14:28 2383

原创 高级综合工具StratusHLS学习笔记(3)

学习目标:学习如何使用Stratus IDE生成存储器模型学习如何在代码中使用存储器模型1.存储器生成存储器生成使用Stratus IDE内置的存储器模型生成器,首先使用Stratus IDE打开工程,在左侧边栏中打开project选项卡,打开libraries,右键Memories,选择New Memory Library新建存储器库,新建后可以在工程下发现同名文件夹...

2020-03-27 15:18:02 1226

原创 高级综合工具StratusHLS学习笔记(2)

学习目标为:如何使用高级综合生成流水线如何使用Stratus进行层次化设计1.生成流水线Stratus允许指定一个主循环(while(1))中的内容为流水线方式实现,即每个时钟周期均可以进入数据执行,需要在主循环开始时添加如下语句指定使用流水线实现:HLS_PIPELINE_LOOP(<STALL_TYPE>, <cycle>, <nam...

2020-03-25 13:51:56 1154

原创 高级综合工具Stratus学习笔记(1)

本次学习参考Stratus内置的学习例程(simple_p2p),学习内容主要如下所示:Stratus HLS软件运行需要的必要文件及其写法Stratus HLS软件操作方式Stratus HLS内置的p2p端口的基本使用(非流水线)Stratus HLS自定义数据类型1.Stratus HLS必要文件与写法Stratus工程所需要的文件如下图所示:文件类...

2020-03-19 21:34:56 2826

原创 存储器体系结构学习笔记

首发于个人博客存储器性能评价指标存储器停顿周期数存储器的性能直接影响到CPU的性能评价,定义存储器停顿周期数为CPU等待存储器访问而停顿的时钟周期数,由此有CPU执行时间有:因此需要存储器停顿时钟周期数越小越好,对于这一变量有公式如下:其中,缺失率表示存储器访问指令中会产生cache缺失的百分比;缺失代价表示发生cache缺失后为了解决缺失需要消耗的平均时钟周期数...

2020-01-05 14:47:59 1328

原创 EIE结构与算法映射

首发于个人博客算法基础EIE(Efficient Inference Engine)的算法基础是一种被称为Deep Compression的神经网络压缩算法。EIE可以说是为Deep Compression量身定制的硬件,Deep Compression的算法流程如下所示:剪枝:将小于某个阈值的权值直接置为0,这一操作引入权值的稀疏性量化:这...

2019-07-22 23:25:00 536 2

原创 基2FFT原理

首发于个人博客FFT前置知识FT和DFT傅里叶变换FT(fourier transform)用于将时域信号和频域信号之间变换,公式如下所示:对于计算机系统中,无法处理连续的过程,因此离散化为离散傅里叶变换DFT(Discrete Fourier Transform):取,可将DFT改写为以下公式:DFT改进(削减计算量)首先分析原始...

2019-07-10 00:06:00 5106 1

原创 浮点数处理

本文首发于个人博客浮点数表达IEEE754标准是用于规范浮点数运算的IEEE标准,用于解决浮点数标准混乱的问题。其被认证后不久,几乎所有的处理器生产商都采用这一标准,极大的推动了软件的发展。浮点数存储的格式如下:float.png浮点数由符号位,指数位和尾数三个部分组成,表达公式如下式:在IEEE754标准中,主要规定了单精度浮...

2019-05-28 23:17:00 1015

原创 异步FIFO设计

本文首发于个人博客1.设计目标设计一个参数可配置的异步FIFO,要求:FIFO深度从4开始在2的幂次方连续可配(4、8、16、…)读写时钟域相位差、频率差任意(同步器参数可配)2.参数列表名称默认值说明DEPTH_LOG4FIFO容量为2DEPTH_LOG2^{DEPTH\_LOG}2DEPTH_LOGDATA_WIDTH8数据位宽3....

2019-05-06 22:17:59 2490

原创 Octave卷积学习笔记

本文首发于个人博客Octave卷积Octave卷积的主题思想来自于图片的分频思想,首先认为图像可进行分频:低频部分:图像低频部分保存图像的大体信息,信息数据量较少高频部分:图像高频部分保留图像的细节信息,信息数据量较大由此,认为卷积神经网络中的feature map也可以进行分频,可按channel分为高频部分和低频部分,如图所示:对于一个feature map,将其按通道分...

2019-05-05 22:56:19 2283

原创 转置型FIR实现

1.设计目标设计基于单口SRAM的转置型FIR,半并行实现,要求满足:并行程度与串行程度参数可配置数据位宽可配置,支持负数,负数为补码类型2.参数表名称默认值说明PALL_PAM4并行阶数PALL_PAM_LOG2并行阶数LOG值SERI_PAM4串行阶数SERI_PAM_LOG2串行阶数LOG值DATA_WIDTH16...

2019-04-24 22:54:45 822

原创 转置型FIR设计

本文首发于个人博客1.设计目标设计基于单口SRAM的转置型FIR,半并行实现,要求满足:并行程度与串行程度参数可配置数据位宽可配置,支持负数,负数为补码类型2.参数表名称默认值说明PALL_PAM4并行阶数PALL_PAM_LOG2并行阶数LOG值SERI_PAM4串行阶数SERI_PA...

2019-04-24 22:40:00 611

原创 SystemC入门笔记

首发地址个人博客变量说明数据类型SystemC为C++的一个库,因此C++的特性在SystemC中均可以使用,数据类型同理,除了C++中的数据类型外,SystemC也有一些自己的数据类型,如下所示:二值变量:sc_bit和sc_bv<n>(n为宽度)分别为二值(0、1)变量和任意位宽二值向量。四值变量:sc_logic和sc_l...

2019-01-22 23:48:00 7579 1

原创 DianNao运算单元与体系结构分析

首发于个人博客运算单元基本信息名称参数数据输入位宽bit权值输入位宽bit数据输出位宽bit功能矩阵乘法、最大值池化、平均值池化乘法器数量加法器数量结构strutrue.pngNFU的整体结构如上所示,该部分分为三个部分,分别是NFU-1、NFU-2和NFU...

2018-12-24 11:08:00 365

原创 AXI学习笔记-1

本文首发于个人博客1.AXI总线结构AXI总线由5个通道构成:通道名称通道功能数据流向read address读地址通道主机->从机read data读数据通道(包括数据通道和读响应通道)从机->主机write address写地址通道主机->从机write data写数据通道...

2018-11-18 18:15:00 2140

原创 P2P接口Booth乘法器设计

本文首发于个人博客描述Booth乘法器是一种使用移位实现的乘法器,实现过程如下,对于乘法:扩展A的位数为n+1位,添加,则A变为:从i=0开始,到i=n-1结束,依次考察的值,做如下操作:若,不进行操作若,若,最后,舍弃R的最右端1位,即获得原理其原理比较容易理解,对于以上乘法,可以分解为:以上是位移乘法器的原理,那...

2018-11-15 00:01:00 261

原创 SSD目标检测系统

首发于个人博客系统结构system.pngSSD识别系统也是一种单步物体识别系统,即将提取物体位置和判断物体类别融合在一起进行,其最主要的特点是识别器用于判断物体的特征不仅仅来自于神经网络的输出,还来自于神经网络的中间结果。该系统分为以下几个部分:神经网络部分:用作特征提取器,提取图像特征识别器:根据神经网络提取的特征,生成包含...

2018-11-04 22:12:00 593

原创 YOLO后处理

首发于个人博客理论分析system.pngYOLO从v2版本开始重新启用anchor box,YOLOv2网络的网络输出为尺寸为[b,125,13,13]的tensor,要将这个Tensor变为最终的输出结果,还需要以下的处理:解码:从Tensor中解析出所有框的位置信息和类别信息NMS:筛选最能表现物品的识别框解码过程解...

2018-10-23 13:13:00 5185

原创 神经网络压缩实验-Deep-compression

首发于个人博客,结合论文阅读笔记更佳实验准备基础网络搭建为了实现神经网络的deep compression,首先要训练一个深度神经网络,为了方便实现,这里实现一个两层卷积+两层MLP的神经网络class net(pt.nn.Module): def __init__(self): super(net,self)...

2018-10-05 17:22:00 1725 8

原创 Deep-compression阅读笔记

同步发布于个人博客基本步骤pipeline.png以上是Deep compression中所述的神经网络压缩方法,主要包括三个步骤:剪枝:将部分很小的(认为不重要的)权值设为0,使权值矩阵转为一个稀疏矩阵量化:将剪枝后保留的权值进行量化,使剪枝后保留的权值共享一些的使用一些值,这样可以减小保存权值使用的空间,进一步压缩所需要的存...

2018-09-16 13:16:00 334

原创 Faster-RCNN阅读笔记

首发地址系统架构structure.pngFaster-RCNN是Fast-RCNN的后续版本,主要针对Fast-RCNN速度过慢进行优化。在Fast-RCNN中,速度的瓶颈主要是用于生成候选区域的Selective Search过程。在Faster-RCNN中,候选区域的生成使用RPN网络,且共享的使用了卷积产生的特性,由此将候选区...

2018-09-05 16:07:00 210

原创 流水线式p2p接口的分析与实现

0.简介P2P接口是一种双向握手接口,传输的前级和后级各提供一个数据有效信号valid和忙信号busy信号,只有当两个信号达成某种指定情况时,握手完成,数据传输完成,否则数据传输均未完成。这可以看成一种分布式控制方式,每个模块的开发人员仅需要考虑上下级的握手信号即可。1.端口端口名类型位宽功能din_validinput1...

2018-08-19 22:39:00 909

原创 P2P接口串行FIR设计

设计目标设计一个仅使用一个乘法器单元的参数化串行FIR,要求:FIR参数可配置具有双向P2P握手协议,可嵌入P2P流水线中当流水线后续被阻塞时,要求完成当前运算再进入等待状态结构框图structure.png整体结构如上图所示,共分为4个模块:P2P输入模块:输入模块,接收P2P握手信号,将数据传递给FIR滤波器并控制整个...

2018-08-18 15:13:00 474

原创 Fast-RCNN阅读笔记

公式渲染完整版请移步个人博客系统架构structure.png由于RCNN存在流水线过长,检测速度慢的问题,Fast-RCNN几乎将整个过程置于深度学习的框架下,因此带来了准确率和速度的提升,该系统主要组成部分如上图所示,有:CNN特征提取器:与RCNN不同,该网络的输入为整张图片,输出为特征张量候选框提取:与RCNN相同使用S...

2018-08-07 13:26:00 148

原创 RCNN学习笔记

公式渲染完整版请移步个人博客系统结构structure.pngRCNN物品目标识别系统如上图所示,如图所示,共分为四步:候选区域提取:使用Selective search选择候选区域,并进行预处理,全部处理为相同大小CNN特征提取:使用CNN将特征区域图像提取为一个特征向量SVM分类:使用支持向量机判断支持该候选区域是否属于某...

2018-07-19 10:10:00 99

原创 LBP特征物品识别系统

公式完整版请移步个人博客系统结构structure.pngLBP是一种常规的人脸识别使用的特征,系统架构如上图所示,主要分为三个部分:滑动框:滑动框在图片上滑动,产生不同的子图LBP特征提取器:针对滑动框产生的子图,计算LBP特征分类器:根据LBP特征,判断当前图片是否是人脸LBP特征原始LBP特征原始LBP特征是一个...

2018-07-16 13:34:00 366

原创 HoG特征SVM物品识别系统

公式完整版渲染请移步个人博客系统架构structure.png该系统仍然是基于滑动框+传统机器学习的目标识别系统,分为两个主要部分:HoG特征提取:从滑动框中提取出的子图中提取HoG特征支持向量机(SVM):以子图的HoG特征为输入,判断该子图中是否有物品HoG特征该系统的最大贡献为提出基于梯度的HoG(locally n...

2018-07-16 13:20:00 616

原创 harr特征加级联分类器的目标检测系统

推测由于渲染引擎问题,部分公式渲染不正常,公式完整版请移步个人博客1.识别系统架构harr_system.png以上是Harr特征+级联分类器的识别系统架构图,系统分为以下几个部分:滑动框:固定大小的在原图上滑动的框,用于获取子图Harr特征提取器:在子图上提取指定的四种Harr特征(获取的特征非常多)级联分类器:基于选定的一...

2018-07-03 23:40:00 743

原创 目标检测技术指标

由于部分行间公式渲染不成功,公式完整版请移步个人博客mAP:识别准确率mAP在目标检测中用于判断识别的准确率,即用于衡量物品被检测出的概率,其跟以下两个指标有关:Precision(准确率):检测出的“物品有多少是真的物品Recall(召回率):数据集中的物品有多少被检出对于以上两个概念,将其置于标准二分类问题框架下有以下公式:$$P...

2018-07-03 23:24:00 790

原创 YOLOv2与YOLOv3学习笔记

部分行间公式由于未知问题无法渲染,公式完整版请移步个人博客基本思路YOLOv2是YOLO的第二个版本,该物品检测系统仍然只需要“Look Once”,其整体结构如下所示:yolo_main.png其主要由两个部分构成:神经网络:将图片计算为一个13\times 13 \times 125的向量,该向量包含了预测的物品位置和类别信...

2018-07-03 23:09:00 319

原创 YOLO1学习笔记

终于解决了毕业的一系列问题,简书和个人博客恢复正常更新频率(当然我断更这么久也没人发现不是【摊手】)惊喜的发现简书有了公式渲染功能,但是大型公式还是渲染不出来,因此公式完整版请参见个人博客基本思路YOLO(You Only Look Once)是一种目标检测系统,其特点是将物品识别和物品分类融合,使用一个深度学习模型直接计算出物体的位置和类型。基本...

2018-07-03 22:56:00 181

原创 DianNao系列加速器总结(2)——存储与映射

由于本文公式较多,简书不支持公式渲染,完整版已发布在个人博客存储DianNao系列的存储的设计理念是分裂存储,这样有几个好处:增大带宽:相同大小的单个存储器和多个存储器相比,多个存储器能提供更大的带宽匹配位宽:有些数据对位宽的需求不同,将位宽需求不同的数据放在不同位宽的存储器中可以避免位宽浪费DianNao与DaDianNaoDianN...

2018-05-14 18:40:00 769 2

原创 DianNao系列加速器总结(1)——架构与运算单元

本文为DianNao系列加速器总结的第一篇,有较多公式,简书不支持公式渲染,公示完整版待该总结完成后将统一发表在个人博客简介DianNao系列是中科院计算所推出的系列机器学习加速器,包括以下四个成员:DianNao:神经网络加速器,DianNao系列的开山之作。DaDianNao:神经网络“超级计算机”,DianNao的多核升级版本ShiD...

2018-05-01 22:38:00 1716 3

原创 神经网络优化算法总结

由于本文公式较多,简书不支持公式渲染,公式完整版请移步个人博客或参考专栏优化算法框架优化算法的框架如下所示:$$w_{t+1} = w_t - \eta_t \\eta_t = \cfrac{\alpha}{\sqrt{V_t}} \cdot m_t$$其中,$w_i$为i时刻的权值,$\eta_i$为i时刻的优化量;$\alpha$为学...

2018-04-24 21:30:00 706

原创 AHB学习笔记

1.AHB概述AHB总线是一种专为高性能同步传输设计的总线,层次高于APB总线,支持以下特性:突发传输拆分事务主设备单时钟周期传输单时钟沿操作非三态实现宽数据总线配置(64/128bit)1.1.典型AHB系统典型的AHB系统包括以下部分:可支持高带宽传输的主干总线AHB主设备(如高性能CPU和DMA设备等)AH...

2018-04-18 21:06:00 8179

原创 基于Pytorch的CapsNet源码详解

本文由部分公式,因简书不支持公式渲染,公式完整版请移步个人博客CapsNet基本结构参考CapsNet的论文,提出的基本结构如下所示:capsnet_mnist.jpg可以看出,CapsNet的基本结构如下所示:普通卷积层Conv1:基本的卷积层,感受野较大,达到了9x9预胶囊层PrimaryCaps:为胶囊层准备,运算为卷积...

2018-04-17 22:33:00 1631

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除