提高网络模型表达能力:增加深度、宽度、输入的分辨率
手写self-attention
介绍图神经网络
为什么L1更容易稀疏
AUC怎么计算
手写个attention的伪代码
conv底层实现方式
小目标检测性能提升方法
网络训练慢如何定位瓶颈
transformer的非线性来自于哪里
trnasformer为甚恶魔用LN,不用BN
旋转角度的IOU计算
Dropout的原理和计算
平均池化和最大池化优缺点
MobileNet的设计理念是什么?
有哪些优化方法使用了二阶导数?
优化器的发展历程
各种normalization的作用
介绍通道注意力与特征注意力
介绍transformer的encoder模块
transformer中的残差结构以及意义
深度学习学习笔记——常见知识点
于 2021-12-09 21:37:01 首次发布
本文探讨了提高网络模型表达能力的策略,包括增加深度、宽度和输入分辨率,并介绍了自注意力机制的手写实现。同时,讲解了图神经网络的工作原理,以及L1正则化为何能诱导稀疏性。此外,还涉及AUC的计算方法、Attention的伪代码、卷积层的底层实现和小目标检测的优化技巧。针对网络训练速度问题,提出了定位瓶颈的方法。文章还深入讨论了Transformer中的非线性来源、层归一化(LN)的应用及其与批量归一化(BN)的区别,以及旋转角度的IOU计算。最后,阐述了Dropout的作用、平均池化与最大池化的优缺点,以及MobileNet设计理念和二阶导数优化方法。
部署运行你感兴趣的模型镜像
您可能感兴趣的与本文相关的镜像
Yolo-v5
Yolo
YOLO(You Only Look Once)是一种流行的物体检测和图像分割模型,由华盛顿大学的Joseph Redmon 和Ali Farhadi 开发。 YOLO 于2015 年推出,因其高速和高精度而广受欢迎
37万+

被折叠的 条评论
为什么被折叠?



