近期,为便捷智能文档处理流程,TextIn文档解析推出内测版本,支持内置参数,完成去水印与切边矫正处理,有效提升解析准确率与输出结果质量。
如何获得内测资格:
内测功能以白名单邀请制的形式进行小范围测试,如有需要,请联系我们进行开通。
内测功能详情见下:
✨内置参数,去除图片和PDF水印
实操场景下,部分带有明显水印的文件,会在解析过程中由于水印干扰产生错漏字现象。
TextIn ParseX将去水印功能内置到了产品中,帮助提升解析效果,减少文件另行去水印带来的时间消耗,同时也让代码编写更为便捷。
「使用示例」
▶步骤一:登录TextIn官网TextIn - API中心,获取app-id和secret-code。
▶步骤二:调用官方示例代码:
1import requests
2import json
3
4def get_file_content(filePath):
5 withopen(filePath, 'rb') as fp:
6 return fp.read()
7
8class TextinOcr(object):
9 def__init__(self, app_id, app_secret):
10 self._app_id = app_id
11 self._app_secret = app_secret
12 self.host = 'https://api.textin.com'
13
14 def recognize_pdf2md(self, image, options):
15 """
16 pdf to markdown
17 :param options: request params