支持多种数据来源的ocr识别,GOT-OCR2.0模型部署
GOT-OCR2.0模型是一种代表了光学字符识别(OCR)领域最新进展的高性能通用OCR解决方案。
GOT-OCR2.0模型在设计上追求极致的通用性和灵活性,旨在克服传统OCR系统中遇到的各种局限性,并为用户提供了前所未有的文本识别体验。
GOT-OCR2.0通过一个结构优化的vision encoder + input embedding layer + decoder架构实现了高效的数据处理,其中encoder部分采用带local attention的VITDet架构来有效管理显存使用。
原创
2024-10-25 06:00:00 ·
1154 阅读 ·
0 评论