- 博客(6)
- 资源 (3)
- 收藏
- 关注
原创 Non-Blocking Simultaneous Multithreading:Embracing the Resiliency of Deep Neural Networks阅读
Paper title:Non-Blocking Simultaneous Multithreading:Embracing the Resiliency of Deep Neural NetworksPublication:MACRO’20这篇文章是提出了一个可以在运行时进行加速的方法,争对的是量化后的INT8矩阵,文中提出在模型的推理中,因为RELU的使用等原因,模型中常常会出现很多的零值,对INT8也会有高四位为零或第四位为零的情况,如下图:在这些主流模型中,只有大约20%的运算是纯8bit8b
2020-11-22 22:19:30
215
原创 Look-Up Table based Energy Efficient Processing in Cache Support for Neural Network Acceleration 阅读
Look-Up Table based Energy Efficient Processing in Cache Support for Neural Network Acceleration这篇文章主要讲的是在CPU的SRAM上运用PIM进行加速,基于的是查表技术。SRAM的组织方式是一个CPU对应一个SRAM切片,一个切片中有4个体,一个体中有10个子体,一个子体中有8个子阵列,一个子阵列又能分为4个子阵列分区,如下所示:整体的设计如下所示,在SRAM中分出一些地方存查找表条目,同时存储CB(c
2020-11-16 21:38:34
338
原创 ngrok内网穿越 腾讯云+ngrok+Windows客户端
硬性需要: 一台有域名的服务器。Tips: ngrok的内网穿透是以服务器为桥接的,即服务器做一个复读机,读一遍你内网的话传出去,这种内网穿透是受限于服务器带宽的,想用这种方式做提高网速,就不要想了。处理流程: 服务器端生成证书,将证书拷贝至指定位置,编译出服务器端软件(Linux上运行服务器),和Windows端软件(自己的电脑上运行服务器),用ftp将Linux上编...
2019-03-15 16:17:02
746
原创 tab自动补齐的c++实现
用过Linux系统的人哪怕是初学者,估计也会对TAB补齐有好感现在要在windows平台下模拟一个Linux的文件系统,TAB补齐这么赞的功能怎能缺失便自己写了一个玩玩:代码在下面:// tab.cpp: 定义控制台应用程序的入口点。//#include "stdafx.h"#include <stdio.h>#include <string>#include ...
2018-07-06 02:03:04
2244
原创 三分法
即在二分的基础上对分出来的小区间进行二分,这样可以得到三个小区间。 先举一个网上比较常见的例子:求凹凸函数的极值点。字很丑,请见谅。总结一下:三分法是二分的二分,它的效率其实没那么高,不仅需要判断两个点,不仅需要判断两个点,而且好的情况下是范围变为一半,坏的情况呢则变为3/4,比二分法的稳定1/2差了不少。但是三分法可以对一个近似二次函数的那样的曲线进行搜索极值点,二分法却做不到。同...
2018-03-15 00:05:51
386
转载 RSA的优点
RSA算法的优点和原理关于RSA的两篇很好的文章: http://www.ruanyifeng.com/blog/2013/06/rsa_algorithm_part_one.html http://www.ruanyifeng.com/blog/2013/07/rsa_algorithm_part_two.html 在1976年以前,所有的加密方法都是同一种模式: (1)甲方选择某一种加密...
2018-03-11 17:36:25
7774
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人