合合TextIn产品有着大量的功能,包括但不限于文字识别,表格识别,ppt内容提取,文档格式转化等.
在这里我主要用到的是通用文字识别,先注册一个账号,购买对应的使用次数,在工作台里就可以看到公有API.
在账号管理里可以看到app_id和secret_code,这是调用接口的凭证.
在对应api的文档里有着详细的使用说明,以及不同语言的示例代码帮助你快速上手,这里我使用的是java的Springboot框架.
我在根目录下创建了一个配置文件,用来存储appid等信息,这样之后有变化可以方便更改.
新建了一个PropManager的工具类用来打开配置文件.
public class PropManager {
public static Properties getOCRProp(){
Properties prop = new Properties();
try{
prop.load(new FileInputStream("ocrstudy.properties"));
} catch (IOException e) {
throw new RuntimeException(e);
}
return prop;
}
}
因为内容不多,我直接在Controller层完成代码.
这段函数中,传入了多张图片,实现了读取所有图片文字内容并拼接的功能.
先读取配置文件中的url和appid和secretcode,url是api的请求连接,在TextIn