中英文文字图像相似度特征值检测软件 与我之前那篇文章:离线中英文文字图像匹配度检测软件(基于CLIP、Transformers等实现) 原理、结构都相似,要想看更具体的描述见该文章,不同之处是输出每句文本对于被检测图片的相似度特征值大小,而不是使用 softmax层进行归一化处理,应用场景不同,这样可以体现出每个文本对应图片的具体相似度的值大小。