Transformer 有可能替代 CNN 吗?现在下结论还为时过早。
Transformer 的跨界之旅,从 2020 延续到了 2021。
2020 年 5 月,Facebook AI 推出了 Detection Transformer(DETR),用于目标检测和全景分割。这是第一个将 Transformer 成功整合为检测 pipeline 中心构建块的目标检测框架, 在大型目标上的检测性能要优于 Faster R-CNN。

DETR-R101 处理的全景分割结果。
2020 年 10 月,谷歌提出了 Vision Transformer(ViT),能直接利用 Transformer 对图像进行分类,而不需要卷积网络。该模型可以获得与当前最优卷积网络相媲美的结果,但
Transformer在目标检测、图像分类等领域取得进展,但是否能替代CNN仍存在争议。研究显示,Transformer与CNN结合能实现更好效果,但Transformer的计算效率问题有待解决。未来研究方向包括优化Transformer结构以适应视觉任务,开发多任务模型和高效Transformer模型。
订阅专栏 解锁全文
1706

被折叠的 条评论
为什么被折叠?



