
论文学习
文章平均质量分 94
莫叶何竹
微信公众号:莫叶何竹
个人主页:http://myhz0606.com/
展开
-
Attention Free Transformer(AFT)
paper: An Attention Free Transformerdate: 2021-05org: Apple原本基于dot product self attention Transformer的时间复杂度和空间复杂度都很高。提出了一个新的AFT层来降低transformer的计算量。首先回顾一下经典的Multi-Head Attention(MHA),每一个head的计算如下fi(X)=σ(Qi(Ki)Tdk)Vi, s.t. Qi=XWiQ,Ki=XWiK,Vi=XWiV,(1)f _ { i原创 2023-09-16 15:16:34 · 1428 阅读 · 3 评论 -
TinyViT: 一种高效的蒸馏方法
收缩因子有6个:embedding的维度、每个stage中block的个数、最后3个stage 的window size、MbConv block的通道扩展率、transformer中MLP的通道扩展率、多头attention,每个头的维度。作者认为主要的原因可能是imagenet21k的有些标签间的类间差异很小,例如椅子和家具,马和动物,因此基于one-hot的GT标签不能很好的表征物体的类别信息。A: 模型的性能随着数据量的增加而呈现加速度不断降低的增大,同样的数据量,最终的性能受限于模型的大小。原创 2023-06-30 08:06:28 · 830 阅读 · 0 评论 -
【论文翻译】PSENet:Shape Robust Text Detection with Progressive Scale Expansion Network
手动翻译仅供参考。原文地址: https://arxiv.org/pdf/1806.02559.pdf论文代码的开源地址:https://github.com/whai362/PSENetShape Robust Text Detection with Progressive Scale Expansion Network0 摘要目前文本框检测的鲁棒性面临两个挑战:一是大多数基于四边形边界的检测器很难将任意形状的文本包围在矩形中;二是大多数基于语义分割的检测器可能不会分离彼此非常接近的文本实例。为翻译 2020-06-13 09:38:18 · 785 阅读 · 0 评论 -
【深度学习之目标检测论文学习(一)】combining FCN and RNN for 3D Biomedical Image Segmentation
论文地址:https://papers.nips.cc/paper/6448-combining-fully-convolutional-and-recurrent-neural-networks-for-3d-biomedical-image-segmentation.pdf论文摘要3D图像的分割是生物医学图像分析中的基本问题。深度学习(DL)方法已经实现了最先进的分割性能。利用神经网络探查...原创 2019-04-10 11:26:17 · 835 阅读 · 0 评论 -
医疗影像GAN应用合集(搬运)
地址:https://github.com/xinario/awesome-gan-for-medical-imaging转载 2019-06-27 13:40:15 · 1144 阅读 · 0 评论 -
[转]医学图像分割综述
原作者:Zeynettin Akkus & Alfiia Galimzianova & Assaf Hoogi & Daniel L. Rubin & Bradley J. Erickson时间:2017csdn作者链接:https://blog.youkuaiyun.com/xy9476/article/details/80587151(转载为收藏)Abstr...转载 2019-07-30 13:58:27 · 4464 阅读 · 2 评论 -
DeepLab v2论文阅读笔记
deepLab v2 论文阅读笔记作者的3个contributions:使用空洞卷积,在不增加计算量的获得增大感受野First, we highlight convolution with upsampled filters, or‘atrous convolution’, as a powerful tool in dense prediction tasks. Atrous con...原创 2019-08-02 16:14:27 · 607 阅读 · 0 评论