Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
Paper Reading Note
URL:https://arxiv.org/pdf/2103.14030.pdf
Milestone!!
transfomer屠榜cnn的最新力作
cnn老年迟暮,transfomer新王加冕
文章的出发点:
对于nlp和cv来说两个领域的scale不同,粒度的差距,nlp中词语token都是固定的然而cv中的patch这种scale是vary substantial的,也就是cv的scale有着很大的变化范围。
对于cv来说,resolution远超nlp。计
原创
2021-04-27 21:06:44 ·
498 阅读 ·
0 评论