注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路
如有侵犯,请联系作者下架
本文识别已同步上线至OCR识别网站: http://yxlocr.nat300.top/ocr/other/14
在之前腾讯混云刚更新时,我们使用clip基本上可以应付,但是部分验证码,涉及到比较明确的语义题目,该题目数据集如下:
从动物的数量、种类、颜色、奔跑跳跃的状态来判断合适的动物图片,其实有聪明的读者已经想到了,这种题目利用GPT去回答也是可以的,确实,但如果想实现自己的模型呢,这个时候你可能去找一些多模态模型相关的文章去阅读,你也有可能还是利用yolo去检测识别,这两种方法都可以,两个方法的准确度都很高,区别就是第一种成本高时间高,而第二种相对不那么耗时耗力,所以,这里还是采用第二种方法去做