
深度学习
Anfanger4De
菜是原罪
沉心静气
展开
-
四、深度学习常用软硬件介绍--EECS486/CS231n
HardwareFP32 can do 2 floating points operations (multiply and add) per clock cycle.if we use tensor core to calculate the computational capacity: (72 SM)x(8 tensor core per SM)x (128 FLOP/cycle) * (1.77Gcycle/sec)=130 TFLOP/secAnd all output elements原创 2020-08-23 01:59:04 · 453 阅读 · 0 评论 -
三、卷积神经网络结构及其发展历程--深度学习EECS498/CS231n
AlexNetOutput size:通道数和滤波器数量保持一致,均为64H/W = (H - K + 2P)/S + 1 = (227-11+4)/4+1=56Memory(KB):Number of output elements: C * H* W=64*56 *56=200704; Bytes per element=4 (for 32-bit floating point). KB=200704 * 4/1024 = 784Parameters(k):Weight shape =原创 2020-08-23 01:56:35 · 439 阅读 · 1 评论 -
二、神经网络基本结构-深度学习EECS498/CS231n
why RELU works?Vector DerivationBut Jacobian is sparse: off-diagonal entries are all zero! Never explicitly form Jacobian.结果我们发现,dy/dx_1,1 = [3,2,1,-1]其恰好是w的第一行,故而不需要显性地进行求解。dL/dxi,j=(dy/dxij)⋅(dL/dy)=(wi)⋅(dL/dyi,:)\begin{array}{l}\mathrm{dL} / \m原创 2020-08-23 01:52:46 · 663 阅读 · 0 评论 -
一、基础知识之数学基础与线性分类器--深度学习EECS498及CS231n
最近邻算法复杂度Train: O(1)对于最近邻算法,训练阶段只是简单地记忆下所有的训练数据,对于浅拷贝而言只需要记录其指向数据集的指针Test: O(N)此处N为训练集的大小,即每做一次判断需要把测试样例和训练集的每一个样本进行Distance计算,对于test而言,O(N)的复杂度是不可接受的线性分类器的三个视角从代数角度来看,学习了一个线性函数的权重,即一个权重矩阵从视觉角度来看,对于每一个类别,找到一个具有代表性的模板从几何角度来看,寻找的是一个超平面正则化原创 2020-08-23 01:46:10 · 510 阅读 · 0 评论