云晓阿-优快云博客

原创 triplet loss

为了打好基础，还是得深入理解代码啊啊啊，虽然看到代码都头疼，能咋整，还是一点一点来吧T-T，仅自留，毕竟我还是研0的小白。一、loss部分首先就是一个难样本挖掘的三元组损失。class OriTripletLoss(nn.Module): """Triplet loss with hard positive/negative mining. Reference: Hermans et al. In Defense of the Triplet Loss for ..

2020-12-11 10:18:57 830

原创 AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

刚入这块的小白，写个博客督促自己深入弄懂文献，仅为个人理解。其中代码来自https://github.com/lucidrains/vit-pytorch这篇文章最大的创新点就是把transformer给运用到了cv中，做了一个图像分类，但是这个模型的性能依赖于pretrain，需要大量数据集。方法（ViT）这个主要分成四步。①因为transformer的输入是一个序列，而图片是一个三维的，所以先得把图像给转化成序列数据。将H×W×C的图片切分成N个P×P×C的图像块，其中序列长度..

2020-12-07 15:18:21 7035 6

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人