1.下载paddleOCR的数据集,发现训练与测试标签txt为这样

2.上图中的数字对应官方给的字典中的汉字的行数

3.将标签转换为能够训练的标签

4.转换代码
#include <fstream>
#include <iostream>
#include <vector>
#include <string>
using namespace std;
int main() {
int n = 5990;
vector<string> dict;
ifstream infile;
infile.open("C:\\Users\\JSM-SQ\\Documents\\DataSet\\key_dict.txt", ios::in);
for (int i = 0; i < n; i++) {
char data[100];
infile >> data;
//cout << data << endl;
dict.push_back(data);
}
infile.close();
infile.open("C:\\Users\\JSM-SQ\\Documents\\DataSet\\data_train.txt", ios::in);
ofstream outfile;
outfile.open("C:\\Users\\JSM-SQ\\Do

本文介绍如何将 PaddleOCR 数据集中的训练与测试标签转换为可训练的格式,并提供转换代码示例及转换后的标签下载链接。
最低0.47元/天 解锁文章
881

被折叠的 条评论
为什么被折叠?



