动手学深度学习
文章平均质量分 77
ww0118
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
11优化算法
在深度学习中,优化算法的目标函数通常为训练集的损失函数,故优化的目标为减少训练误差。深度学习的目标是减少泛化误差。原创 2024-09-27 09:44:05 · 1001 阅读 · 0 评论 -
注意力机制
queries和attention_weights的形状为(查询个数,“键-值”对个数)# values的形状为(查询个数,“键-值”对个数)原创 2024-09-27 09:48:51 · 1789 阅读 · 0 评论 -
现代循环神经网络
为了缓解这一问题,这里我们将出现次数少于2次的低频率词元 视为相同的未知(“”)词元,并指定了填充词元(“”), 以及序列的开始词元(“”)和结束词元(“”)。通过截断(truncation)和 填充(padding)方式使得每个文本序列都有相同的长度,,便于小批量加载。穷举地列举所有可能的输出序列及其条件概率, 然后计算输出条件概率最高的一个,计算量为。如果遗忘门始终为1且输入门始终为0, 则过去的记忆元。权衡精度与计算量,介于穷举搜索与贪心搜索之间。从输出候选序列中,选择条件概率乘积最高的序列。原创 2024-09-27 09:45:43 · 934 阅读 · 0 评论 -
12计算性能
有一个用于与用户直接交互的前端(例如通过Python),前端线程不需要执行实际的计算,程序的执行主要发生在C++实现的后端。使得命令可以快速地异步插入后端、并行执行。混合式编程:结合两者的优点,通过。原创 2024-09-27 09:45:11 · 478 阅读 · 0 评论
分享