- 博客(33)
- 收藏
- 关注
原创 BLIP-2论文精读
由于大规模模型的端到端训练,视觉和语言预训练的成本越来越高,BLIP-2是一种通用且高效的预训练策略,可以从现成的冻结的预训练图像编码器和冻结的大型语言模型引导视觉语言预训练。
2024-04-27 21:51:44
1025
原创 SSD算法
可以更好的预测目标情况,浅层特征图包含了较多的细节信息,更适合进行小物体的检测。而较深的特征图包含了更多的全局信息,更适合大物体的检测。FC6对应第一个蓝色的全连接层,FC7对应着第二个蓝色的全连接层。我们修改了maxpooling的结构,因此其中的分辨率不发生改变。由于在匹配过程中,大多数的default box都是负样本,会造成在训练过程中。,因此一个分辨率大小为mxn的网络,我们的输出为。的问题,因此为了解决这个问题,我们选取。的负样本,使正负样本之间的比值处于。的特征图,对于每一个。
2023-04-23 11:18:32
177
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人