RAG 企业知识库
文章平均质量分 91
以实战为主,分享 RAGFlow、Dify、n8n 等产品在实际应用场景的解决方案。
企业知识库布道者
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
一个程序员团队的 2025:关于创业、知识库,以及不想被定义的人生
《程序员创业记:从技术到产品的知识库实践》摘要: 2025年,一支由4-5名程序员组成的团队基于RAGFlow二次开发了KnowFlow企业知识库产品。团队凭借数据治理经验,瞄准私有化场景下的准确率痛点,通过优化文档解析、分块策略和工程化能力,服务了30+企业用户。从开源社区互动到获得首笔订单,团队完成了从技术执行者到产品决策者的角色转变。文章分享了选择知识库赛道的三大理由、真实企业面临的RAG痛点,以及团队在产品定位、技术取舍和商业化过程中的思考。未来将持续深耕多模态RAG和国产化生态建设。原创 2025-12-23 14:15:04 · 586 阅读 · 0 评论 -
KnowFlow 知识库一键导入导出:打破在线与离线的边界
KnowFlow v2.1.9推出知识库导入导出功能,解决企业离线环境知识管理痛点。该功能支持在线环境利用强大算力完成文档解析、智能分块和向量化处理后,将完整知识库导出为压缩包,通过物理介质快速部署到离线环境。相比传统方式,可降低80%硬件成本,提升5-12倍效率,实现秒级知识库迁移。功能包含完整元数据导出、多模式导入及严格校验机制,适用于金融、制造等需要网络隔离的场景,保障业务连续性和合规要求。测试显示万级文档导入仅需1小时,显著优化企业知识管理全流程。原创 2025-11-25 15:28:27 · 413 阅读 · 0 评论 -
KnowFlow 牵手百度 PaddleOCR-VL,开启高精度文档解析新时代
KnowFlow v2.1.8 正式发布!本版本最大的亮点是与百度飞桨团队深度合作,集成了业界领先的,为用户带来更高精度的文档解析能力。同时,我们在产品易用性和用户体验方面也做了诸多优化,让企业级知识库管理更加便捷高效。KnowFlow 是专注于的企业级知识库产品,将结构化与非结构化数据治理成对大模型更可信的输入,致力于构建 AI 时代的数据根基。原创 2025-11-18 18:47:27 · 419 阅读 · 0 评论 -
KnowEval:RAG 工程化的最后一公里,让问答质量有据可依
在 AI 时代,数据质量决定了应用质量。KnowFlow 解决了数据治理的问题,让知识库"可信";KnowEval 解决了质量评测的问题,让 RAG 系统"可控"。数据治理 + 质量保证 = RAG 工程化的完整闭环降低 RAG 应用的开发门槛:从数据准备到质量保证,全流程工具化提升 RAG 应用的质量上限:通过数据驱动优化,持续提升问答效果加速 RAG 应用的落地速度:从几个月缩短到几周甚至几天将结构化与非结构化数据治理成对大模型更可信的输入,构建面向未来的数据治理平台,重塑 AI 时代的数据根基。原创 2025-11-10 18:05:01 · 855 阅读 · 0 评论 -
多模态 RAG 以文搜图在 RAGFlow 中的实践,自动化测试为 API 质量保驾护航,KnowFlow 全新 UI 重磅来袭
KnowFlow v2.1.6版本发布,带来三大核心更新:1)实现"以文搜图"功能,通过视觉模型增强图片描述并向量化存储;2)全面重构UI设计,采用AI生成的设计规范优化视觉体验和加载性能;3)新增API自动化测试体系,确保80余个接口的稳定性。本次更新还修复了多个技术缺陷,优化了分块检索逻辑和聊天提示词。产品定位聚焦于构建可信数据治理平台,未来将深化与Agent平台的整合并拓展智能数据分析能力。社区版已同步更新至v2.0.8版本。原创 2025-10-21 11:11:14 · 1219 阅读 · 0 评论 -
RAGFlow 适配 MinerU v2.5.4, 支持 vlm 和 pipline 双模式;MinerU/Dots 无缝接入 RAGFlow,新增父子、语义、标题、正则切片方法
摘要:RAGFlow适配MinerUv2.5.4,支持vlm和pipline双模式,新增父子、语义、标题、正则切片方法。架构设计采用解析器与分块方法分离,提升复用性和维护性。优化了RBAC权限检查,响应速度从700ms提升至200ms,并修复了坐标映射等问题。MinerUv2.5.4识别效果显著,支持自动跨页表格合并。未来将聚焦多模态开发,实现图文搜索功能。开源社区版已更新至v2.0.8。原创 2025-10-10 17:19:37 · 1246 阅读 · 0 评论 -
RAGFlow 全面接入 MinerU 2.0,支持 pipeline、vlm-transformers、vlm-sglang 三种模式,解析精度大幅度提升
KnowFlow v1.0.0正式接入MinerU 2.0,主要解决原架构耦合度高、部署困难的问题,并显著提升文档OCR识别准确率。新版支持三种部署模式,重点推荐vlm-sglang-client模式,在单卡4090上可达10,000+tokens/s的吞吐量。项目采用组件化设计,提供轻量级和完整版Docker镜像,并开放源码方便二次开发。开发者发烧期间仍坚持完成版本发布,强调开源项目的价值在于技术分享与社区认可。未来计划继续深入RAGFlow源码解读、开源前端代码,并通过视频平台推广项目。原创 2025-06-30 11:45:27 · 4148 阅读 · 0 评论 -
RAGFlow 插件支持自定义正则分块、Excel 分块增强
RAGFlow 插件最新版本优化了文档分块功能,新增自定义正则分块策略,支持前端配置分块参数。作为RAGFlow的兼容扩展项目,重点解决企业场景落地问题。针对Excel处理,改进解析策略,动态计算分块大小并优化合并单元格处理,但保留行列关联问题待后续检索专题解决。未来计划接入MinerU 2.0并转向Docker服务架构,后续将聚焦源码解读与混合检索等核心功能。该项目已开源,欢迎社区交流。原创 2025-06-23 11:00:42 · 1550 阅读 · 0 评论 -
实战复盘 | 基于视觉模型的多模态 RAG 系统,我们踩过的坑与收获 (项目已开源)
目前市场内主流的 RAG 系统技术方案,以文本为主。将 PDF、Word、图片、Excel 等不同格式的文件通过 OCR 解析成文本、表格、图片等数据,通过 chunk 存储到向量数据库。而基于视觉模型的方案反其道而行之,采用类似于 ColPali 框架实现对文档的向量化存储。检索阶段通过相似度得分获取到高关联性的图片,将这些信息喂给视觉模型如 Qwen2.5 VL,视觉模型最终将结果返回给用户。原创 2025-05-31 13:08:22 · 972 阅读 · 0 评论 -
我们为什么放弃传统RAG?实测案例告诉你,多模态RAG有多强!
传统文本RAG系统在企业落地中面临准确率不足的痛点,主要源于复杂文档中的图片、表格等非文本信息导致的信息丢失。多模态RAG通过融合视觉语言模型(VLM)和文本处理能力,展现出显著优势:1)直接生成图像向量,避免OCR信息损失;2)实现图文语义的深度理解;3)实测在表格提取、文档总结等场景实现精准回复。虽然存在计算资源消耗大的挑战,但问答质量的飞跃式提升使其成为RAG发展的关键方向。KnowFlow团队正在基于ColPali等先进方案研发多模态产品,推动企业知识管理的升级。原创 2025-05-26 17:22:46 · 879 阅读 · 0 评论 -
DeepSeek 大模型点燃 AI 市场,企业知识库、智能客服成关键落地场景
传统知识库 & 智能客服:通过叠加大模型能力逐步升级。AI Native 方案:直接基于 RAG、Agent 构建,灵活性更高,但仍处市场早期。未来,企业知识库的演进方向包括:✅数据安全与合规—— 确保企业数据隐私,支持私有化部署。✅高准确率—— 结合混合检索与智能推理,提高 AI 回答的正确性。✅多模态支持—— 处理文本、图片、音频等多种数据类型。✅行业深度应用—— 结合具体行业需求,打造高适配度的 AI 解决方案。AI 时代的企业知识库,不仅仅是存储与检索工具,更是推动企业效率提升的重要引擎。原创 2025-05-04 21:21:38 · 797 阅读 · 0 评论 -
RAGFlow 接入企业微信应用实现原理剖析与最佳实践
受制于篇幅,本文着重介绍了企微应用该场景,事实上企业微信近期还推出了「智能机器人」产品,可以在群聊里提供智能机器人能力。这里就不再展开,有兴趣的同学可以深入交流交流。另外 KnowFlow 发布了 v0.2.0 版本,图文混排能力再度升级,支持自定义分块以及坐标溯源。在保障文档解析和分块效果的前提下准确定位分块在原文档的位置。上述所有源码均已开源,欢迎关注「KnowFlow 企业知识库」获取源码和相互交流。原创 2025-05-04 21:02:49 · 1956 阅读 · 0 评论 -
RAGFlow 企业知识库团队和权限管理详解
团队和权限管理是企业级知识库必不可少的一个功能,其中 RAGFlow 官方方案提供更加细粒度的权限控制,可以针对指定知识库配置团队的读取/写入/管理权限。在实际客户落地过程中,可以有效帮助客户控制知识库权限问题,避免潜在的信息泄露问题。如官方不开源该功能,我们也可以选择三方的方案,虽然粒度粗了点,但也基本够用。除了团队和权限管理功能以外,接下来我们团队对 RAGFlow 项目要做的是:全新 UI 和交互设计增强结构化输出能力,支持表格、图文混排应用最新的文档 OCR 引擎,如 MinerU。原创 2025-04-25 11:18:24 · 3787 阅读 · 3 评论 -
真实测评!RAGFlow、FastGPT、Dify、QAnything 谁是准确率之王?
在进入测评前,我们简单了解一下 RAG。检索(Retrieval):从知识库中找到与用户问题相关的信息。生成(Generation):基于检索到的信息,利用大语言模型生成答案。这种方式可以大幅提升问答的准确性和相关性,尤其在应对企业知识库场景时表现突出。原创 2025-04-25 11:14:31 · 1548 阅读 · 0 评论 -
RAGFlow 如何实现图片回答?KnowFlow 的实战方案来了(附源码,该方案已升级,最新可看专栏)
之前博文中有提到,KnowFlow(基于 RAGFlow 二次开发的商业化产品) 计划要开发以下三个核心功能:重构 RAGFlow 前端页面以及交互进一步增强 RAGFlow 文档解析能力完善 RAGFlow 结构化输出能力,支持图片、表格、图标等输出形式。原创 2025-04-25 11:07:42 · 3457 阅读 · 0 评论 -
企业知识库图文混排再升级:可视化前端一键解析【已开源】
上周我们团队开源了 RAGFlow 知识库支持图文混排后,有同学私信我们能不能做一个前端出来,释放双手。企业生产环境下知识库管理者通过,效率将会大幅度提升。文档上传完成后,在 RAGFlow 进行问答,便可以。原创 2025-04-25 10:55:49 · 953 阅读 · 0 评论 -
RAGFlow 企业知识库距离真正的商用,还有多远?
在大模型越来越聪明、上下文长度越来越长的趋势下,RAG 是不是要退出历史舞台?我的回答是恰恰相反:RAG 反而可能会随着技术的进步进一步演化,甚至在某些场景下变得更加重要。因为 RAG 有一些天然的特性是可以和大模型相辅相成的,如知识的时效性、减少计算和存储成本、知识安全可控。未来的趋势可能是超长上下文 和 智能检索双管齐下,以应对不同应用场景的需求,真正的给企业降本增效,进入 AI 时代。最后介绍下我们团队 KnowFlow:基于 RAGFlow 的专注于私有化部署的企业知识库服务商。原创 2025-04-25 10:25:00 · 1817 阅读 · 0 评论
分享