近期,为便捷智能文档处理流程,TextIn文档解析推出内测版本,支持内置参数,完成去水印与切边矫正处理,有效提升解析准确率与输出结果质量。
如何获得内测资格:
内测功能以白名单邀请制的形式进行小范围测试,如有需要,请在后台联系我们进行开通。
内测功能详情见下:
1 内置参数,去除图片和PDF水印
实操场景下,部分带有明显水印的文件,会在解析过程中由于水印干扰产生错漏字现象。
TextIn ParseX将去水印功能内置到了产品中,帮助提升解析效果,减少文件另行去水印带来的时间消耗,同时也让代码编写更为便捷。
-
使用示例:
步骤一:登录TextIn官网TextIn - API中心,获取app-id和secret-code。
步骤二:调用官方示例代码:
import requests
import json
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
class TextinOcr(object):
def __init__(self, app_id, app_secret):
self._app_id = app_id
self._app_secret = app_secret
self.host = 'https://api.textin.com'
def recognize_pdf2md(self, image, options):
"""
pdf to markdown
:param options: request

最低0.47元/天 解锁文章
611

被折叠的 条评论
为什么被折叠?



