
深度学习
文章平均质量分 75
关于深度学习领域知识的讲解
littlepeni
每月努力更新一次博客!
展开
-
一文解读Masked Autoencoder(MAE)
如果说Vision Transformer是Transformer在CV领域的拓展,那么Masked Autoencoder就是BERT在CV领域的拓展。MAE使用类似于BERT的掩码机制,从图片中随机抹去一些像素,并让模型通过已知像素去构建未知像素,从而迫使模型学习图像中的特征。实验证明:MAE具有很好的像素重构能力。原创 2022-04-02 16:44:41 · 24264 阅读 · 0 评论 -
主成分分析PCA(非常详细)
今天在某乎上面看到了一篇关于主成分分析的文章,让我有一种醍醐灌顶的感觉,讲得很清晰明了,在这里分享给大家。原文地址:https://zhuanlan.zhihu.com/p/77151308转载 2021-01-07 10:29:22 · 13759 阅读 · 0 评论 -
一文教你搞懂2D卷积和3D卷积
本人最近在搞毕设时发现自己一直会搞混2D卷积和3D卷积,于是在网上查阅了大量资料,终于搞明白了其中的原理。希望刷到这篇博客的小伙伴能够停下来静心阅读10分钟,相信你读完之后一定会有所收获。原创 2022-03-07 18:07:29 · 34178 阅读 · 8 评论 -
一文解读Vision Transformer(ViT)
Vision Transformer打破了CNN在计算机视觉领域的统治地位,仅使用一个标准的Transformer Encoder(与NLP领域中使用的Transformer相同),并在大规模数据集预训练的情况下,就能达到和CNN一样甚至更好的效果,可以说是填补了CV和NLP之间的鸿沟。原创 2022-03-22 10:36:13 · 21142 阅读 · 1 评论