
开源
文章平均质量分 87
Liekkas Kono
开源组织RapidAI主理人。RapidOCR核心开发者
展开
-
RapidOCR集成PP-OCRv5_rec模型(mobile/server)记录
该文章主要记录RapidOCR集成PP-OCRv5_mobile_rec和PP-OCRv5_server_rec模型记录的,涉及模型转换,模型精度测试等步骤。原创 2025-05-31 14:27:59 · 1097 阅读 · 0 评论 -
如何在mkdocs-material文档主题下设置多版本文档系统?
在查找相关资料过程中,我发现没有一个较为完整清晰的文章来具体说明如何部署使用多版本文档站点的。最近得知,PaddleOCR文档站点需要支持多版本文档功能。这个需求是可以实现的,因为当时调研各个文档工具时,mkdocs-material是支持部署多版本的文档需求的。该部分分为了2个workflow,一个是日常更新main分支,自动发布到对应文档版本下;另外一个是release tag时,自动发版到对应tag的文档站点。如果release代码时,会自动根据tag名称为当前文档生成tag对应的文档站点版本。原创 2024-10-14 16:18:59 · 972 阅读 · 0 评论 -
发布中文文档类资源仓库-ChineseDocumentPDF
因此,我就考虑能否收集一些在线可获取的中文文档,并对它们做标注,算是促进中文文档智能的发展吧!而当前现状是中文文档场景数据集较少,不像英文文档有arXiv网站,国内中文论文并没有一个类似arXiv的聚集地,中文论文都是散落在各个期刊自建网站上。该资源可以与360发布的版面分析模型相结合使用,具体来说,用他们的模型给新的PDF图像打标注 → 人工校验 → 再次训练模型,迭代更多数据,模型就会越来越准。通过版式分析模型,我们就可以提前知道给定文档中,哪里是表格、哪些是图表,哪些是公式,哪些是文本段落等。原创 2024-06-13 22:16:27 · 822 阅读 · 0 评论 -
Github Discussions使用指南(建议收藏)
无论您是在规划功能路线图、询问有关您正在做的事情的问题,还是与构建您所使用的软件的开源社区互动,GitHub Discussions 都为所有社区(开源和私人)提供了一个连接和协作的中心空间。为对话和提问提供一个集中的社区空间(并使维护人员在处理问题和拉取请求时的生活更轻松)为新手和非代码协作者创建一个参与更大社区的地方突出项目贡献者以帮助培养下一代维护者现在就尝试在您的公共或私有资源库中启用它,或者与您有兴趣了解的任何开放源代码社区进行互动。翻译 2024-06-06 22:44:17 · 1408 阅读 · 0 评论