深度学习笔记2

原创已于 2024-05-13 23:23:46 修改 · 108 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#笔记

于 2023-05-22 18:39:31 首次发布

在表达式中，我们通常用方括号表示层数，而用圆括号表示单独的训练量

神经网络的图从左往右依次为：输入层【0】（一般不作正式层）；隐藏层【1】；输出层【2】；输出

激活函数：将线性函数转化为非线性函数；并且将范围框定在0-1之间。

对于二元分类，sigmoid函数更为合适，而对于其他种类的分类则更多选择relu函数（更多选择）或者tanh函数

（从上到下依次为Tanh函数和RelU函数）

leaky RelU函数 a=max（0.01z，z）

如果使用线性激活函数，那么神经网络的深层也就没有了意义，因为输入和输出之间可以整合为一个式子。但是如果输出的是一个实数，而不是类似与0或1的判断值，那么就可以用线性激活函数（恒等激活函数）。至少隐藏层不应使用线性激活。

初始化w变量不能全设为0，因为这样会导致依照该变量计算的值完全相等，没有任何区别，这样就没有了计算的意义。这种情况称为对称失效。

这样设置 w的初始值可以更好的使激活函数发挥作用，以免产生因步长过大而导致的激活函数效果不明显的后果。0.01适合浅层的神经网络。

计算交叉熵成本时可以不用循环就可以算出答案

logprobs = np.multiply(np.log(A2),Y)
cost = - np.sum(logprobs)                # 不需要使用循环就可以直接算出来。

在两层的神经网络中这个求导公式可以解决连接问题

前一半是对整个结构的求导，而后一半是对自身的求导。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Y111eason

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

深度学习知识点全面总结

专注大数据与人工智能技术分享，欢迎私信加群互相学习！

01-05

37万+

本文详细介绍深度学习概念及原理，参考网上相关资料汇总，内容包含众多章节，包括神经网络基础及常见深度学习网络结构介绍，用于个人学习总结，适合深度学习初学者学习。同时介绍机器学习常见的分类算法：SVM、神经网络、随机森林、逻辑回归、KNN、贝叶斯。常见的监督学习算法：感知机、SVM、人工神经网络、决策树、逻辑回归.........

深度学习笔记（二）

m0_63604019的博客

11-01

2272

卷积神经网络的整体架构

参与评论您还未登录，请先登录后发表或查看评论

深度学习 学习笔记总结

qq_43588670的博客

12-26

1869

这周将深度学习的东西写一点总结吧，也算是对研一的一个小总结，要加油呀呀呀。提示：以下是本篇文章正文内容，寻欢桑知识水平有限，请大家多多批评1.IMDB 是一家在线收集各种电影信息的网站和豆瓣类似，用户可以再上面发表对电影的评价。IMDB数据集御用情感分析的IMDB电影评论二分类数据集，包含25000个训练样本和25000个测试样本，所有影评都被标记为正面和负面两种评价。IMDB数据集地址#导入IMDB模块#导入数据。

李宏毅深度学习Transformer笔记

m0_61803871的博客

12-11

4177

记录了李宏毅老师的Transformer课程的笔记。

python学习笔记（深度学习）

qq_39748832的博客

06-25

1584

本篇博客用来记录，在深度学习过程中，常用的 python 语法内容。

李宏毅深度学习笔记——呕心整理版

Red_Elf的博客

12-06

9798

机器学习就是寻找一个复杂函数。深度学习的函数就是类神经网络。

【李沐】动手学深度学习 学习笔记

热门推荐

chenxiaowai_的博客

03-21

3万+

你好！这是【李沐】动手学深度学习v2-基于pytorch版本的学习笔记教材源代码安装教程（安装pytorch不要用pip，改成conda，pip太慢了，下载不下来）个人推荐学习学习笔记本节代码文件在源代码文件的chapter_deep-learning-computation/custom-layer.ipynb中不带参数的层下面的CenteredLayer类要从其输入中减去均值。要构建它，我们只需继承基础层类并实现前向传播功能。让我们向该层提供一些数据，验证它是否能按预期工作。带参数的层。

深度学习吴恩达笔记

liuzhiyuanzui的博客

10-15

2687

个人笔试，不全

【李沐】深度学习笔记

~yzzheng～的博客

04-06

1176

学习李沐深度学习的笔记内容

神经网络和深度学习（学习笔记）

weixin_52471034的博客

09-12

1746

1.1 感知机1.1 感知机当代多数神经网络论著主要使用名为 sigmoid 神经元的神经元模型。但要理解 sigmoid 神经元的来由，需要先了解感知机。感知机接收若干个二进制输入(x1,x2......) ，并生成一个二进制输出，其中，一般来说会使用权重（w1，w2.....）来表示输入的重要程度。神经元的输出究竟是 0 还是 1，则由加权和于或大于某个阈值来决定。类似于权重，阈值也是实数，且是神经元的一个参数。

精选资源

吴恩达深度学习笔记.pdf

11-21

【吴恩达深度学习笔记】是一份针对吴恩达教授在Coursera平台上的深度学习课程的详尽笔记，旨在帮助已有一定编程基础和机器学习知识的计算机专业人士深入理解和应用深度学习技术。该课程分为5个部分，涵盖了深度学习...

Deeplearning深度学习笔记v5.571

08-03

黄海广博士及其团队的努力使得这些深度学习课程的中文笔记得以持续更新，为中国的学生和AI爱好者提供了便利的学习资源。这些笔记有助于加深对课程内容的理解，尤其是在没有完整字幕的情况下。通过这个深度学习课程...

吴恩达Deeplearning深度学习笔记v5.7.pdf

06-22

我设置的价格是0，优快云下载多了会自动提价，如有需要，请点击：...吴恩达 Deeplearning深度学习笔记v5.7 最新PDF版免积分下载 https://blog.youkuaiyun.com/ftimes/article/details/106911087

深度学习笔记包含机器学习 深度学习

03-01

深度学习笔记的整理涉及对机器学习基础概念、深度学习模型构建、训练技巧以及应用案例的详细记录，为AI算法工程师提供了宝贵的学习资源。在机器学习的基础层面，监督学习和无监督学习是两大主要的学习范式。监督...

Javaweb 学习笔记——html+css

hssfscv的博客

12-18

904

以上是Javaweb中关于前端html和css的相关内容，主要制作了两个页面，了解了如何使用AI生成我们需要的内容，有利于了解前端知识，接下来将进行剩余前端知识的学习

【算法笔记】AC自动机

最新发布

u012559967的专栏

12-19

515

AC自动机: AC自动机是一种高效的多模式字符串匹配算法，它巧妙地将 Trie树的字典结构与 KMP算法的失配指针思想相结合，能同时在一段文本中查找多个模式串的所有出现位置，广泛应用于敏感词过滤、生物信息学序列分析等领域。在字符串匹配领域，我们会遇到两类问题：单模式匹配：给定一个文本字符串和一个模式字符串，判断模式字符串是否出现在文本字符串中。《【算法笔记】KMP算法》多模式匹配：给定一个文本字符串和多个模式字符串，判断所有模式字符串是否出现在文本字符串中。解决方案：AC自动机算法。

Android学Dart学习笔记第十四节库和导库

weixin_44656996的博客

12-15

808

其他语言中的访问修饰符关键字提供了更细粒度的控制，而Dart使用下划线和基于库的隐私提供了直接的配置机制，有助于高效实现动态访问，并改进了树抖动（死代码消除）。库不仅提供api，还是隐私的单位：以下划线（_）开头的标识符只在库内部可见。当你导入的多个库中，使用了相同的类名时，可以为库起个别名，使用别名.类名明确指定所引用的类。使用import来指定如何在另一个库的作用域中使用来自一个库的命名空间。带有通配符_的导入前缀是不绑定的，但可以访问该库中的非私有扩展。

【大模型】happy-llm笔记

weixin_45207619的博客

12-16

160

今天看了这套课程的第二章到第四章的内容，对自己一直以来好奇的一些llm相关的问题有了解答。将我遇到的问题整理到下面，部分可能没有回答，感兴趣的同学可以去原课程查找。happy-llm是datawhale发布的一套关于llm的教程，链接。

北京大学国家发展研究院经济学辅修经济学原理课程笔记（第七课国际贸易）

hanmo22357的博客

12-16

694

核心差异：大国可以通过关税影响世界价格，从而产生贸易条件改善的收益。这是小国做不到的。福利影响的复杂性：正因为贸易条件效应的存在，大国征收关税是否对自身有利，需要根据具体情况进行详细讨论，不再是一个简单的必然受损的结论。配额的影响：在大国情景下，配额同样会因为限制贸易量而影响世界价格。其作用与关税类似，但主要的区别仍然在于，由国内外价差和世界价格变动所产生的超额利润（即“配额租金”或“贸易条件收益”），会流入拥有配额许可的企业手中，而不是进入政府国库。

算法笔记19 - 图和通用结构 | 图的两种遍历 | 三种拓扑排序 | 两种最小生成树算法Kruskal, Prim | 最短路径算法Dijkstra

zyw4259的博客

12-16

790

本文提出了一种通用的图结构设计方案，包含节点(Node)、边(Edge)和图(Graph)三个核心类，能够将不同输入格式的图统一转换为标准结构。基于该结构实现了两种图遍历算法：BFS采用"进队时标记"策略避免重复访问，DFS通过"curr回压+break"技巧模拟递归调用栈。此外还介绍了三种拓扑排序方法，重点分析了基于入度的Kahn算法(BFS思想)，通过维护入度表和零入度队列实现。这种"通用结构+标准算法"的设计模式可以有效降低不同图算法题目间的