- 博客(3)
- 收藏
- 关注
转载 【文档智能 & RAG】RAG新基建-RAG性能增强关键技术点及通用文档解析工具-TextIn
本文将先探讨下文档解析的准确性对RAG系统的影响;然后介绍下智能文档解析关键技术,并介绍闭源的通用文档解析服务——TextIn,还介绍了一款开源的文档解析质量评测工具-Markdown Tester,最后介绍下合合信息开发的向量表征模型-acge_text_embedding。 RAG一般流程在RAG的预处理阶段,文档解析的准确性是至关重要的。如果文档解析不准确,这将直接影响到后
2024-10-31 14:49:51
90
转载 TextIn国内通用票据识别:23大类、30小类票据一站式分类识别,识别率再次提升!
依托合合信息多年积累的票据文字OCR识别能力,可识别包含增值税发票、医疗发票、数电票、火车票、出租车发票、飞机行程单、网约车行程单等在内的23大类、30小类国内通用票据,提取其中的信息,并以整理成标准结构化的Key/Value形式返回或导出。可清晰区分票据,自动切边提取票面信息,智能识别票据类型,便捷切换展示分类识别结果,支持多类票据批量上传、混合扫描、切图、分类、识别。支持识别jpg、png、bmp、tiff等多种通用图片格式,以及PDF、OFD格式。标准化API接口,支持智能分类,无需手动指定。
2024-10-31 14:31:15
127
原创 学习笔记(01):Python入门教程-用不占内存的方式的修改文件
您观看课程学习后可入群领取【超全Python资料包+17本学习电子书】 即使之前你从未写过1行代码,也能在学完本课程后,达到Python入门水平,能开发300-500行代码的小程序,掌握基本的编程思维、软件设计方法。无论你日后想做人工智能、数据分析,还是WEB开发、爬虫、大数据等,都应该先把这部分基础掌握。 ...
2020-02-07 20:26:00
252
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人