- 博客(18)
- 收藏
- 关注
原创 知识库智能应用在大项目中落地实战总结(不喜勿喷)
大模型实战应用,知识库智能应用才是王道,怎么用到极致。重点是片段加问题,一起输入给模型。片段是由问题在嵌入模型搜索出来的,经过排序模型排序的结果。真正问题=前缀要求+搜索内容+返回格式。规避模型长度限制。
2025-06-17 21:56:13
81
原创 PaddlePaddle,PyTorch,TensorFlow主流深度学习技术的对比分析
大模型技术很多思想来源于深度学习,PaddlePaddle,PyTorch,TensorFlow主流深度学习技术的对比分析。
2025-05-14 22:20:58
1520
原创 pdf文件既有图片又有文字的解析方案,混合使用OCR技术(含源代码)
本文针对混合PDF(文本+图片)的解析需求,提出了一种高效准确的动态处理方案。通过PDFBox判断页面类型——文本页直接提取内容,图片页则渲染为高清图像后调用PaddleOCR识别,实现精准的混合解析。文章详细分析了三类处理场景(纯文本、纯图片、混合型),给出完整的Java实现代码,包含页面类型检测、文本提取、OCR集成等核心模块,并附Maven依赖配置。同时提供两种PaddleOCR集成方案(Python调用或Java SDK),建议通过图像预处理和并行计算优化性能。该方案兼顾了结构化文本的解析效率与图像
2025-05-14 22:08:02
1184
原创 大模型项目实战应用心得,在大型国央企应用心得分享
大模型这么多,没有大型项目实战使用过就没有话语权,本人从事java,python,代码,架构10来年,写点近几年大模型实战心得吧,这里通过大模型实战应用心得,在大型国央企应用心得分享。主要包括模型选择,服务器选型(一般需要国产化,不能使用A100,T4等英伟达系列),PDF解析,业务接入,知识库抽取,结果呈现,运维云计算。重点是知识库抽取,难点是pdf解析准确性。如有问题欢迎互相交流
2025-05-11 19:03:54
574
原创 如何使用RAGFlOW知识库模型,调用RAGFlOW接口
使用RAGFlOW知识库模型,调用RAGFlOW接口,通过调用RAGFlOW的API,进行调用
2025-05-07 23:29:31
2164
比对文件查重进行排除文件的策略,源代码
2025-05-12
如何使用RAGFlOW知识库模型,调用RAGFlOW接口
2025-05-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅