- 博客(253)
- 资源 (3)
- 收藏
- 关注
原创 [AICG]连接万物的CLIP
CLIP是一个将文字和图片结合在一起的模型,利用来自自然语言的监督输入,将图片和文字进行配对,实现Zero-Shot的图像分类,其精度甚至可以媲美有监督训练的ResNet50。如上图所示,由于CLIP学习的是语义信息,更接近于我们用语句描述图片的行为,在域变化非常明显的情况下模型依旧能表现出良好的效果。:如图(2)所示,将ImageNet中的标签转换为一个个句子(造句),使用预训练好的文本编码器,将这些句子转换为特征向量。,来链接其语义和文本信息,在特征矩阵中,对角线上相互匹配的图片文本对是。
2025-02-15 12:33:14
720
原创 [卷积神经网络]YOLOv10论文解读
YOLOv10的改进点主要由两点:①提出一种基于无NMS的一致的双重训练策略;②提出了整体效率-精度驱动的模型架构设计策略。这两项改进使得YOLOv10相较于RT-DETR快1.8倍,比YOLOv9-C在同性能下降低了46%的延迟,减少了1.8倍的参数。
2024-08-15 22:35:19
1490
原创 [神经网络]Anchor_Free网络(YoloX,CenterNet)
Anchor Free的目标检测网络(CenterNet,YoloX)
2023-07-09 21:59:11
2288
2
ImgStringConverter.zip
2020-04-01
WinForm+89C51四路温度采集设计
2018-04-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人