
平地起高楼——CV专栏
文章平均质量分 85
专门介绍基于Transformer结构的CV模型,step by step讲解,结合代码
会震pop的码农
吾生也有涯,而知也无涯
展开
-
Vit Step By Step -- Define Datasets
在第二篇文章中,我们将教会大家如何自己定制化专属的数据集。这里我们用两个非常经典的数据集举例子,一个是MINIST,另一个是我们自己找的花分类数据集。原创 2024-04-23 19:59:38 · 1226 阅读 · 0 评论 -
Vit step by step -- Image 2 patch
在这里我们开一个新坑,这个新坑主要用来讲解的详细实现细节。关于Vision Transformer我们预计开四篇文章把它讲透,每篇文章我们都会代码和输入的样例。关于Vision Transformer的第一篇文章,我们就先实现一下Vision Transformer的第一步——如果把图片变成patches然后输入到Transformer的Encoder当中。图片来源于Vit原文首先我们再回顾一下Vit的原文的标题:图片来源于Vit原文。原创 2024-04-22 21:36:37 · 661 阅读 · 0 评论