
深度学习基础
dqefd2e4f1
这个作者很懒,什么都没留下…
展开
-
3.8 Softmax回归 3.9 训练一个softmax分类器
3.7Softmax回归(1)Softmax回归的功能: 答案:分类(2)举例: 答案 :系统中输入一张图片P,通过Softmax层,系统会给出该图片是不同类别的概率,比如:是猫的概率0.8,是狗的概率 0.1,是鸡的率0.05,是鸭的概率0.05,最后我们判断图片P上的物体有80%的可能是猫,那么我们把这个图 片P归为猫类。(3)具体过程:...原创 2018-12-04 19:18:12 · 549 阅读 · 0 评论 -
5.2.5学习词嵌入
课前提问问题1:什么是词嵌入?问题2:如何嵌入?课后回答1 什么是学习词嵌入?答案:学习词嵌入是功能,即向系统输入依次几个单词,系统自动预测出下一个单词是什么,eg a glass of orange ___,系统会自动预测出juice这个单词,我们把系统的这种功能叫做“学习词嵌入”。2 如何嵌入?答案:首先需要建立一个神经语言模型(这里需要注意的是吴教授没有用到RNN...原创 2018-12-14 11:07:38 · 135 阅读 · 0 评论 -
5.3.1时序模型和注意力机制--基础模型
课前提问:(1)有哪些基础模型(2)这些基础模型怎么用课后回答:这节课主要讲了两个模型第一个模型:机器翻译第二个模型:图像描述图片里有几个问题,如果有网友知道答案的,请留言!...原创 2018-12-15 18:43:15 · 469 阅读 · 0 评论 -
5.3.2选择最可能的句子
课前提问:1选择最可能的句子是什么意思? 2我想如果有很多句子才可以选择吧,那么这些候选句子是哪里来的?课后提问: 课程中有两个模型,一个是语言模型,另一个是机器翻译。刚开始没有看懂,两者有什么区别? 语言模型:附链接:https://blog.youkuaiyun.com/song_aq/article...原创 2018-12-15 19:56:51 · 167 阅读 · 0 评论 -
5.3.3定向搜索
课前提问:1什么是定向搜索(也叫集束搜索)?2搜索什么东西?3怎么搜索?课中提问:1 集束宽的概念?B=3答案:搜索过程如下图所示原创 2018-12-15 20:34:01 · 1064 阅读 · 0 评论 -
5.3.4改进定向搜索
问题:1 为什么要改进定向搜索,定向搜索有什么缺点?答案:,n个很小的数相乘,最后会得到一个很小很小的数,容易造成四舍五入,精度不准的问题。2 怎么改进定向搜索?答案:(1)由原来的求的最大值,变为求lg()的最大值,这样不容易造成四舍五入的问题。 (2)并且在(1)中表达式的前面加上据说可以起到归一化的作用,为什么会起到归一化的作用,现在还不 知道,反...原创 2018-12-15 22:41:42 · 273 阅读 · 0 评论 -
5.3.6Bleu得分
问题:1 平均分前面的BP参数是什么意思?2 BP参数有什么作用?3 BP参数中,当机器翻译的词数小于参考翻译的词数时为什么会有这样的规定?备注:我认为吴恩达教授的PPT中的BP表达式可能有误,正确的表达式应该是BP = 1 if MT>RBP = otherwise解决办法:看博客,学习别人对Bleu得分的理解。附链接:https://blog.c...原创 2018-12-16 09:37:36 · 354 阅读 · 0 评论 -
5.3.7注意力机制模型直观理解
问题:1注意力机制模型是什么?答案:自己的理解,不·一定对。(1)在RNN的基础上加上一些权重,比如在翻译第一个单词的时候,系统会给予原句子每个单词一些权重,权重的意义是单词的权重越大,那么在翻译“这个词”时,系统会给予这个单词更多关注的关注。(2)权重如何求?不知道?2注意力机制模型有什么用?答案:翻译一个词的时候对原句子中每个词的关注度不一样。这样翻译更合理,准确。3注意力...原创 2018-12-16 10:35:11 · 355 阅读 · 0 评论 -
5.3.8注意力机制(如图)
我的理解如图1所示 图一问题1加入了注意力机制后有什么不同?答案:如果没有注意力机制,只有双循环RNN,那么系统结构就对应图一中的下面两层(黑色,灰色部分),系统会直接输出y1,y2,y3,y4。加入注意力机制后,系统不...原创 2018-12-16 12:23:57 · 289 阅读 · 0 评论 -
RNN的特性(持续更新)
https://www.sohu.com/a/162300065_739762原创 2018-12-16 20:22:55 · 938 阅读 · 0 评论 -
关于深度学习的一些有价值的思考 (持续更新中)
http://www.sohu.com/a/204248921_465975原创 2018-12-13 21:57:21 · 382 阅读 · 0 评论 -
5.1.8带神经网络的梯度爆炸
这节课主要讲了3个问题1梯度消失原因:几个很小的数相乘会得到一个趋近于0的数。2梯度爆炸原因:几个很大的数相乘会的到一个非常大的数,从而造成NaN(数据溢出的问题)3经典RNN的缺点原因:如果RNN神经网络的层数很深,通过反向传播法,信息很难从最后面传到前面。(这个和梯度爆炸和梯度消失有关系)所以有一些科研人员设计了新的神经元,很好的解决了这个问题。...原创 2018-12-13 19:59:19 · 162 阅读 · 0 评论 -
5.1.7对新序列采样
对新序列采样是什么意思?在看完5.1.7课以后有一个疑问:对新序列采样的意义在哪里?我理解的新序列采样的过程是,只有输入样本序列的第一个词,把这个词输入单元内(这个理解是错误的,输入的第一个词是0向量)会得到一个预测y^,将y^作为样本序列的第二个词输入到单元中。如图修正:按照吴老师的说法,在新采样序列中X1,X0均为0,意思是完全不需要样本,系统自动输出一个句子。(提前条件是系统...原创 2018-12-13 18:49:56 · 874 阅读 · 0 评论 -
3.11tensorflow有什么用
见3.10原创 2018-12-04 21:25:31 · 134 阅读 · 0 评论 -
4.1.1计算机视觉有什么用
计算机视觉有什么用?答案:人脸识别(向系统输入一张图片,系统识别这张图片是哪个人) 无人车驾驶(系统会理解当前看到的路面情况,并自动做出反应) 指纹锁 图像分类 图像检测 图像描述 视觉问答 等...原创 2018-12-05 10:38:04 · 220 阅读 · 0 评论 -
4.1.2 边缘检测示例
问题:垂直边缘检测滤波器为什么可以检测垂直边缘?原创 2018-12-05 11:08:53 · 152 阅读 · 0 评论 -
4.1.3更多边缘检测的内容
(1)垂直边缘检测滤波器, ,水平边缘检测滤波器。(2)带参数的滤波器,需要通过训练求出这些参数,任何角度都可以检测出来。原创 2018-12-05 11:16:57 · 148 阅读 · 0 评论 -
4.2.11计算机视觉现状
问题:请概述计算机视觉现状。关键字:数据集 算法答案:现阶段主要研究的内容有图像分类,目标检测,文本识别。一般情况,文本识别用到的数据集非常大,因为文本数据非常容易获取,得到数据的成本较低;目标检测用到的数据集相对图像分类,文本识别较少,因为图像需要标记,在图片上框处目标物体,得到数据的成本较高。问题:有哪些好的经验答案:如果你的数据集很大,那么你不必纠结算法模型,无论用到那种算法...原创 2018-12-07 19:36:00 · 396 阅读 · 0 评论 -
4.1.4Padding是什么
PaddingPadding的中文意思是衬垫,衬料。在卷积神经网络中Padding是一种基本卷积操作。这个操作是为了解决图片在经过很多卷积层后变得过小的问题。例如:这个n*n(6*6)的矩阵经过这个f*f(3*3)的滤波器后会得到一个4*4的矩阵,接下来如果依次经过几个卷积层,图片会变得很小很小。为了解决这个问题,有人提出了Padding方法在正常卷积结束后在图片的外层补上p个框框(补...原创 2018-12-05 14:20:18 · 1386 阅读 · 0 评论 -
4.1.5卷积步长是什么意思
卷积步长也叫卷积步幅,英文名字是stride,代表滤波器每移动一次移动的步幅,s=2则滤波器每次移动2格。举例:Wu教授的方程表达式卷积后图片边长=((n+2p-f)/s)+1...原创 2018-12-05 15:02:20 · 4014 阅读 · 0 评论 -
观看吴恩达教授深度学习-循环神经网络有感
观后感:看完(RNN)循环神经网络后,第一个感觉是没有看懂,具体有几点(1)模型图很抽象,不知道输入的X、Y(即输入输出到底是什么),如果不知道输入输出具体是什么,那么根本无法对样本做标记,那么理解模型的具体算法就无从谈起。(2)卷积神经网络中的参数也很抽象,具体有哪些参数无法从模型图上得知。(3)循环神经网络中的神经元输入输出到底是什么,第i个神经元的输出的什么怎么传到第i+1个...原创 2018-12-12 17:26:54 · 391 阅读 · 0 评论 -
5.1.1时序模型的功能
1机器翻译 :输入某类语言的一句话,输出另外一类语言的一句话。2音乐生成:输入一个数字,生成一段音乐。3行为识别:从video中输入连续的几帧图片,判别图片中人物的行为。4语音识别:输入一句语音,输出一段本文。5情感分类:输入一句评价,输入一个得分(类似于好评等)。6DNA序列分析:输入一段序列,输出对应的蛋白质(我是这样理解的,不一定对)。7名称识别:输入一句话,输出同一...原创 2018-12-13 16:06:08 · 164 阅读 · 0 评论 -
5.3.1 时序模型和注意力机制
这节课讲了什么?答案:这节课主要讲了2个应用。应用1:机器翻译功能:将一句法语输入到系统中,系统自动输出一句英语。训练过程:10000万样本,每个样本包含一句法语,一句英文。模型如下: 应用2:图像描述功能:将一张图片输入到系统中,系统自动输出一句话。训练过程:10000万个样本,每个样本包含一张图片,一句描述。模型如下:...原创 2018-12-11 16:48:38 · 1050 阅读 · 0 评论