total-text数据集的格式不同于CTW-1500和ICDAR家族,后者是直接以坐标的形式存放在.txt文件中的,而total-text的标注格式长这样,取其中一张图的GT为例:
x: [[115 503 494 115]], y: [[322 346 426 404]], ornt: [u'm'], transcriptions: [u'nauGHTY']
x: [[734 1058 1061 744]], y: [[360 369 449 430]], ornt: [u'm'], transcriptions: [u'NURIS']
x: [[558 682 682 557]], y: [[370 375 404 398]], ornt: [u'm'], transcriptions: [u'NURIS']
x: [[562 595 651 687 653 637 604 588]], y: [[347 304 305 360 366 334 332 361]], ornt: [u'c'], transcriptions: [u'nauGHTY']
x: [[603 632 630 603]], y: [[408 413 426 423]], ornt: [u'h'</