动手点关注

干货不迷路
近日,抖音 CV 技术团队在 ICDAR 2023 的“Detecting Tampered Text in Images”比赛中,利用自研的“CAS”算法从 1267 个参赛队伍中脱颖而出,获得分类赛道的第一名。
ICDAR(International Conference on Document Analysis and Recognition),是国际文档图像分析和识别领域公认的权威学术会议,涉及的领域包括文本识别、文本检测、文档分析和自然语言处理等。该会议从 1991 年开始,每两年举办一次,吸引了来自全世界的科学家、工程师和学者参加,分享他们的研究成果和最新技术进展。第 17 届将于 2023 年 8 月在美国加利福尼亚举行。
DTT 竞赛聚焦于真实场景下的文本图像篡改检测。随着文档分析与识别领域的快速发展,新兴技术也在不断涌现,并广泛应用于数字金融、电子商务、安全审核和智慧教育等领域。然而,以往的研究大多集中于文本内容的理解,对于图像本身的真实性关注度较低。与通常针对自然图片中人或物的篡改检测不同,文本的篡改检测在精度和泛化性方面更具挑战性。首先,篡改的区域通常很小,几个字符的改动即可导致整体语义的扭曲,且由于背景缺乏复杂的纹理,篡改区域与邻近区域之间也没有明显的差异。
竞赛简介
竞赛数据集共收录了 19000 张通过拍摄、扫描和截图等多种方式在真实场景下采集到的文本图像,并使用人

抖音CV技术团队在ICDAR2023的“DetectingTamperedTextinImages”比赛中荣获分类赛道冠军,利用“CAS”算法进行文本图像篡改检测。ICDAR是国际文档分析和识别领域的权威会议,此次竞赛聚焦于真实场景下文本图像的篡改检测,具有高精度和泛化性的挑战。团队通过数据扩充、二阶段分类器设计和滑窗采样等技术提升了模型性能。
最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



