批量处理total-text数据集格式

这篇博客介绍了如何将total-text数据集的标注格式批量转换成与CTW-1500和ICDAR家族相似的坐标格式。原始的total-text标注包含坐标、方向和文本内容,而目标格式是(x1, y1, x2, y2, x3, y3, x4, y4...)。通过提供的代码,可以将total-text的标注转换为方便后续处理的CTW-1500样式。" 125682431,517129,使用KUBECTL扩展插件提升效率,"['kubernetes', 'devops']

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

total-text数据集的格式不同于CTW-1500和ICDAR家族,后者是直接以坐标的形式存放在.txt文件中的,而total-text的标注格式长这样,取其中一张图的GT为例:

x: [[115 503 494 115]], y: [[322 346 426 404]], ornt: [u'm'], transcriptions: [u'nauGHTY']
x: [[734 1058 1061 744]], y: [[360 369 449 430]], ornt: [u'm'], transcriptions: [u'NURIS']
x: [[558 682 682 557]], y: [[370 375 404 398]], ornt: [u'm'], transcriptions: [u'NURIS']
x: [[562 595 651 687 653 637 604 588]], y: [[347 304 305 360 366 334 332 361]], ornt: [u'c'], transcriptions: [u'nauGHTY']
x: [[603 632 630 603]], y: [[408 413 426 423]], ornt: [u'h'</
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值