- 博客(2)
- 收藏
- 关注
原创 triplet loss
为了打好基础,还是得深入理解代码啊啊啊,虽然看到代码都头疼,能咋整,还是一点一点来吧T-T,仅自留,毕竟我还是研0的小白。一、loss部分首先就是一个难样本挖掘的三元组损失。class OriTripletLoss(nn.Module): """Triplet loss with hard positive/negative mining. Reference: Hermans et al. In Defense of the Triplet Loss for ..
2020-12-11 10:18:57
792
原创 AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE
刚入这块的小白,写个博客督促自己深入弄懂文献,仅为个人理解。其中代码来自https://github.com/lucidrains/vit-pytorch这篇文章最大的创新点就是把transformer给运用到了cv中,做了一个图像分类,但是这个模型的性能依赖于pretrain,需要大量数据集。方法(ViT)这个主要分成四步。①因为transformer的输入是一个序列,而图片是一个三维的,所以先得把图像给转化成序列数据。将H×W×C的图片切分成N个P×P×C的图像块,其中序列长度..
2020-12-07 15:18:21
6956
6
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人