- 博客(385)
- 收藏
- 关注
原创 Coze Studio 又升了!本地 OLLAMA 向量 + 插件外挂知识库,RAG 体验翻倍提升!
官方开源的代码,这两天做了不少的调整,以前磕磕绊绊的bug都已经修复了,官方也支持了ollama的向量模型。说coze的rag效果不好,这两天看到官方更新了ollama支持,切换到ollama本地做了下尝试。里通过添加插件的方式外挂知识库。只要外部知识库有http请求,就可以外挂上来。更新下官方的代码,特别是镜像重新拉取下,有些脚本都移除了,应该都打包到镜像里了。不要在原有的知识库上操作,重新建一个知识库进行向量化。上次有一个说法不太对,比如外挂知识库,在。还是用上次实验的两个md文件。
2025-08-08 14:08:19
1579
1
原创 Dify 之外的新尝试:Coze Studio 知识库实战指南:部署、解析、接入全流程
coze studio 的向量还在不断地完善过程中,预估这周ollama会上,自定义http需要按规范实现知识库目前不支持外挂,这个在企业中是一个很大的问题,后续开源社区肯定会支持,迟早的问题整体检索效果相对来说比较差,这个可能是我使用的问题。
2025-08-08 14:06:16
1451
原创 AI Agent 新选择:Coze Studio 开源上手实录,能替代 Dify 吗?
提供各类最新大模型和工具、多种开发模式和框架,从开发到部署,为你提供最便捷的 AI Agent 开发环境。提供了一些模型的模板,我们只需要将模板复制,并简单修改下即可。按照官方的说法,2c4g就够了,实际在docker中启动,2.4g,后续随着使用,肯定会越来越大。注意模板所在的路径,需要用哪个模型,复制到model下即可。启动以后这几个带setup的容器,没启动不用管,其他的没启动手动点一下。从访问令牌可以看出,令牌是一个全局性的,而不是只针对某个工作流。所有需要启动的服务启动以后,访问。
2025-08-08 14:05:21
1007
1
原创 沉寂数月的 Ragflow 重磅发布 0.20.0,补齐最大短板!
RagFlow近期迎来重大版本更新,重点改进了Agent功能和MCP支持。Agent方面进行了全面重构,新增多Agent协作、规划反思、视觉处理等功能,并优化了前端编排体验和可观测性。MCP功能实现完整闭环,支持服务端导入、客户端调用及RAGFlow作为服务端。更新还包含新版Infinity集成、API文件引用支持等特性。作者通过艾灸应用案例演示了Human-in-the-loop交互流程,详细讲解了开始节点设置、条件判断、Agent工具调用等关键环节。同时介绍了MCP服务的配置使用方法,并对比了RagFl
2025-08-04 16:39:56
1440
原创 dify项目结构说明与win11本地部署
后续会深度研究下dify,智能体的应用要更广泛一些。我也会根据自己的需求,在dify中中的功能进行增强。
2025-07-11 09:54:05
488
原创 Dify 1.6.0 重磅上线:原生MCP 双向集成、结构化输出升级!
昨天dify又又升级了,这次升级有一个我非常关注的功能MCP。在之前的dify X mcp系列中,使用mcp的时候,是通过三方插件扩展支持的,官方并没有直接支持,使用的时候,就有点不太聪明的意思。
2025-07-11 09:46:33
1580
原创 Dify 1.5.0 上线:这次调试功能,真的省了我一半时间
对我来说,之前调一个流程可能要跑三五遍(三五遍算少的),还要复制变量、格式化数据,耗时又容易出错;现在基本能做到“出错即定位、修改即重试”,工作流开发体验提升非常明显;除了调试,1.5.0 还增加了不少实用的小功能(MatrixOne、SendGrid、Notion分页支持等),大家可以在设置页面自行探索。Dify 这波更新让我明显感觉到它从“可用”向“好用”演进。开发者不需要为了调试浪费时间、重复造数据,这才是真正为工作流开发服务的产品思维。
2025-06-26 22:26:55
1358
原创 RAGFlow 0.18.0 实战解读:从 MCP 支持到插件配置的全流程揭秘(源码)
RAGFlow 0.18.0版本发布,主要新增了MCP功能,允许通过MCP访问知识库。其他改进包括团队协作、Agent版本管理、兼容OpenAI API模型、PDF解析增强等。文章详细介绍了如何手动开启MCP服务并应用于Cherry Studio和VSCode,同时分析了源码中的RAGFlowConnector实现。MCP作为知识库访问接口,为开发者提供了更多集成可能性,但项目目前参与者较少,部分功能仍在完善中。
2025-06-21 11:33:36
1707
原创 MCP不像想象的那么简单,MCP+数据库,rag之外的另一种解决方案
摘要 MCP(Model Context Protocol)是由Anthropic提出的开放协议,旨在统一大模型与外部数据源的交互标准。该协议通过标准化消息、资源和工具等交互原语,解决数据孤岛问题,使应用只需集成MCP客户端即可调用各类服务。与Function Calling相比,MCP更具通用性和互操作性,支持多数据源和动态发现,形成可复用的工具生态。其核心架构基于客户端-服务器模型,支持多种传输机制,并定义四种消息类型。MCP通过资源机制将各类数据(文本/二进制)暴露给客户端,为AI应用提供灵活的数据接
2025-06-21 11:23:13
1671
原创 RAGFlow核心引擎DeepDoc之PDF解析大起底
本文深入解析RAGFlow中的deepdoc模块,重点介绍了pdf文档解析器的实现细节。deepdoc包含parser(文档解析器)和vision(视觉处理)两大核心功能,其中pdf解析是最复杂的部分。文章详细剖析了PdfParser类的设计架构,包含PlainParser(基础文本提取)、RAGFlowPdfParser(核心处理流水线)和VisionParser(视觉扩展)三个类,它们通过统一的__call__方法返回标准化结果。还具体讲解了初始化过程如何加载OCR引擎、布局识别模型、表格结构识别器等关
2025-06-21 11:04:36
1433
原创 深度拆解RAGFlow分片引擎之切片实现
本文深入解析了RAGFlow的文档处理核心组件deepdoc,重点介绍其pdf解析器的实现。文章指出deepdoc包含parser(文档解析)和vision(视觉处理)两大模块,其中pdf解析是最复杂部分。通过源码分析展示了PdfParser类的整体架构,包括三个实现类:轻量级文本提取工具PlainParser、核心处理器RAGFlowPdfParser和功能扩展VisionParser。详细解读了初始化方法__init__的资源加载逻辑和标准解析流程__call__的实现方式,揭示了文档解析、布局分析、表
2025-06-21 10:31:16
1264
原创 深度拆解RAGFlow分片引擎!3大阶段+视觉增强,全网最硬核架构解析
上次讲解代码以后,把rag这块遗留了下来,rag的代码相对来说比较复杂,一环套一环。我们今天先来拆解下分片的整体流程。在最新的版本中,使用视觉模型,对图表进行增强。在这个方法里根据切片配置进行了处理。通过最近的源码解析,ragflow后面的升级有几块。点击文档后面的启动按钮。这里只是把切片的配置做了设置。我们从接口的请求参数和界面对照,大致了解下。执行run_graphrag。我们看下默认分片中的关键方法。执行run_raptor。deepseek相关资料。PDF解析器+布局识别。GraphRAG模式。
2025-04-16 19:20:07
2040
原创 Dify插件内网安装,解决Dify1.x插件安装总失败问题,手把手教你暴力破解:从镜像源到二进制打包全攻略
需要注意的是,由于自己打的包,没有经过dify官方的审核,所以需要修改下配置。如果一般内网都有自己的镜像源,替换下自己的镜像源,在dify的配置文件中改成自己的镜像源即可。有些用户说内网不能联网,没法安装,但是我想说的是,一般内网隔离,一般都会有一些自己的镜像源。安装插件,这块需注意下,不要随意安装别人分享的插件,上传到插件市场的插件,官方应该都会过一遍,要不然也不能叫可信源。,存放的是官方和其他人发布的插件,理论上,我们都下载这两个目录,通过本地上传的方式都能安装上去。安装都是走的pip官方的。
2025-04-15 09:57:53
9299
2
原创 dify1.2.0升级,全新循环节点优化,长文写作案例
前天dify升级到了1.2.0 ,昨天看了下升级日志,心心念的没看到。下面是更新的明细。我重点看重的是下面的两个功能。
2025-04-14 15:06:07
2036
原创 解剖RAGFlow!全网最硬核源码架构解析
api可能是二开最常用的模块了。apps目录主要是 ragflow对外暴露的接口sdk目录是对外提供的api,主要是操作知识库和一些扩展*_app.py的文件都是对ragflow的web提供的接口db目录是操作数据库的封装utils是封装的一些工具。
2025-04-09 14:06:38
2779
原创 从代码逆向RAGFlow架构:藏在18张表里的AI知识库设计哲学
想要了解ragflow,表结构永远是绕不过去。我们连上ragflow的数据库,可以看到,创建有18张表。这些表具有什么含义?今天我们结合ragflow的代码、功能、和表来看一看。在ragflow的代码中,我们先看一下ragflow封装的继承关系。TextFieldMYSQLPOSTGRESJSONFieldListFieldragflow通过BaseModel把数据库的操作基于Peewee ORM进行了封装。
2025-04-08 18:10:05
2260
原创 Dify 1.1.0史诗级更新!新增“灵魂功能“元数据,实测竟藏致命Bug?手把手教你避坑
昨天刚吃过饭,看到dify推送1.1.0的升级,我看了下升级日志。在Dify1.1.0版本中修复了,新增了。官方推介的最重要的功能是元数据。
2025-03-31 10:37:23
3059
原创 从8550秒到608秒!RAGFlow最新版本让知识图谱生成效率狂飙,终于不用通宵等结果了
在ragflow的官方中,关于知识图谱,主要有两个文档,主要内容从0.9.0开始引入依赖于大模型和专有数据库infinity主要增强多跳问答和跨文档查询从v0.16.0版本开始,RAGFlow支持在知识库上构建知识图谱文档中的流程图不再依赖infinity想深读了解的,可以看看我们看下耗时对比。版本构建耗时降幅v0.17.08550秒v0.17.11440秒83%↓v0.17.2608秒58%↓我们可以看到知识图谱的构建是非常花费时间和tokens的。
2025-03-31 10:32:59
2207
原创 RAGFlow爬虫组件使用及ragflow vs dify 组件设计对比
上周末,两台电脑都失联了,一个是断网了,一个被我不小心关机。导致我两天没环境。只能整理,学点东西。上周有个有个群友问我ragflow爬虫的没法使用的问题。幸好周六早上的时候实践了下。
2025-03-19 19:43:24
2303
原创 亲测有效!Win10环境下RAGFlow全栈配置教程(附避坑指南)
做环境管理,单一的python还好一些,我之前安装的是3.9(比较早了)。而有些项目需要3.10,有的需要3.11,有的需要3.12,要么升级,要么安装多套环境。不想用uv,使用conda,建议让kimi写个脚本,把uv.lock里的包都洗出来,洗成。如果你没有修改过docker部署的端口,可以直接使用,如果修改了,需要对应的修改。然而我折腾了一会,安装不上。前端环境需要npm,或者pnpm,我之前一直有对应的环境,我就不折腾了。如果大家自己折腾,建议用uv,直接导入官方提供的,缺有,但是不多。
2025-03-17 08:11:57
6027
10
原创 DeepSeek兼容性评估,企业DeepSeek部署配置选择
昨天压测完以后,今天群里的小伙伴讨论的很热烈,有个小伙伴推荐了一个工具。覆盖两个场景。
2025-03-15 13:56:56
1314
原创 生产环境vLLM 部署 DeepSeek,如何调优,看这里
vLLM 是一个快速且易于使用的 LLM 推理和服务库。vLLM(VeryLargeLanguageModelServing)是由加州大学伯克利分校团队开发的高性能、低延迟的大语言模型(LLM)推理和服务框架。它专为大规模生产级部署设计,尤其擅长处理超长上下文(如8k+ tokens)和高并发请求,同时显著优化显存利用率,是当前开源社区中吞吐量最高的LLM推理引擎之一。高吞吐量:采用先进的服务器吞吐量技术。内存管理:通过PagedAttention高效管理注意力键和值内存。请求批处理。
2025-03-14 08:33:57
2537
原创 模型微调之基础篇:模型微调概念以及微调框架
之前我们一直强调,大语言模型(LLM)是概率生成系统。能力边界知识时效性:模型知识截止于训练数据时间点推理局限性:本质是概率预测而非逻辑运算,复杂数学推理易出错(deepseek的架构有所不同)专业领域盲区:缺乏垂直领域知识幻觉现象:可能生成看似合理但实际错误的内容之前一直讲解如何通过各种不同的知识库进行知识片段的检索,并通过提示词临时注入到大模型。从今天开始,我会写一写微调相关的文章。定义:在预训练大模型(如GPT、BERT)的基础上,使用特定领域或任务的数据进行额外训练,使模型适应新任务。
2025-03-14 08:29:16
1171
原创 你们要的dify增强功能都在这里
我们看下基于dify增加了哪些功能。我把官网的介绍截图下来了,大家可以看看。我比较比较关注的几个功能web公开页登录授权,这个功能能保证了发布的应用,必须登录以后才能使用密钥额度设置,这个做好功能以后,可以对外暴露api,进行付费调用费用报表,方便管理者统计需求,也是提效的依据。
2025-03-10 23:00:26
2498
原创 知识库Dify和cherry无法解析影印pdf word解决方案
多格式转换:支持 PDF、图像、PPTX/DOCX/XLSX/HTML/EPUB → Markdown/JSON/HTML复杂内容提取:表格、公式、代码块、链接,支持图像保留与 OCR 修复,适配论文、金融文档等场景。可扩展优化:通过--use_llm调用 Gemini/Ollama 等模型提升准确率,支持自定义处理规则。
2025-03-07 09:50:57
7444
原创 dify外挂ragflow+千问QWQ,解决dify解析和检索短板
之前一直有粉丝留言说让我出一个dify+ragflow的教程,今天来实操下。
2025-03-07 09:42:44
2329
9
原创 OceanBase-obcp-v3考试资料梳理
集群由一个或多个Region组成,Region 由一个或多个Zone组成,Zone由一个或多个OBServer组成,每个OBServer里有若干个partition的Replica。对应物理上的一个城市或地域,当OB集群由多个Region组成时, 数据库的数据和服务能力就具备地域级容灾能力,当集群只有一个Region时,如果出现整个城市级别的故障,则会影响数据库的数据和服务能力;一般情况下对应一个有独立网络和供电容灾能力的数据中心,在一个Region内的多个Zone之间OB数据库拥有Zone故障时的容灾能力
2025-03-06 17:27:52
1274
原创 DeepSeek+ragflow构建企业知识库:高级应用篇,越折腾越觉得ragflow好玩
从知识检索测试来说,开启知识图谱的检索效果最好。从聊天效果来说,反而通用的更符合我的口味。我的需求不明确,只是随意拿着一份文档测试,测试没有目标性,只是体验下检索的效果以及差异性,这个需要专业的测试。
2025-03-05 10:02:36
2099
1
原创 DeepSeek+ragflow构建企业知识库之工作流,突然觉的dify又香了
我们按照下图的数据介绍组件。ragflow的的官方文档相对来说还是比较欠缺的,特别是用户交互这块。ragflow的ui使用成本相对比较高,组件不知道返回什么,只能根据示例或意图推断使用ragflow建议是有技术底子的英文文档的描述习惯和中文还是有很大的差别的说实话,用着有点崩溃,哈哈。
2025-03-05 10:01:09
1993
原创 DeepSeek+ragflow构建企业知识库:突然觉的dify不香了(1)
从面板上看,就几个功能。还是很清晰,它的模板特别少,在创建agent的时候可以选择。
2025-03-05 09:56:21
2161
原创 DeepSeek+dify 工作流应用,自然语言查询数据库信息并展示
在写连接外部数据库查询的时候,我就想普通的业务人员没有编程背景,不懂数据库,可他们想查询统计一些东西怎么办?只能找对应的开发人员写sql了,那我是不是可以用工作流解决这个问题。我把库表结构从数据库里导出一份表结构,导出到相同的文件里,建立一个知识库。里写的python脚本改下,由关键词检索改成sql检索。技术纵深:高并发架构 | 应用调优 | 分布式系统。管理沉淀:8年技术团队管理 | 百万级DAU经验。的阈值不要调太大,一般0.3即可,别看图。作为查询变量,添加刚才添加的数据库知识库。
2025-03-05 09:53:17
4647
原创 DeepSeek+dify知识库,查询数据库的两种方式(api+直连)
最近大家一直在问我一个,怎么让在个ai应用客户端直接连接数据库查询。dify官方没有现成的组件可以直接用。当时我想的是两种方式,一种是基于代码执行模块直接查询数据库,一种是基于Http请求,调用自己封装接口来查询数据库。
2025-03-05 09:51:08
2678
原创 DeepSeek+dify 本地知识库:高级应用Agent+工作流
工作流通过将复杂的任务分解成较小的步骤(节点)降低系统复杂度,减少了对提示词技术和模型推理能力的依赖,提高了 LLM 应用面向复杂任务的性能,提升了系统的可解释性、稳定性和容错性。一个完整的工作流,必须具备开始和结束两个节点。Chatflow:面向对话类情景,包括客户服务、语义搜索、以及其他需要在构建响应时进行多步逻辑的对话式应用程序。Workflow:面向自动化和批处理情景,适合高质量翻译、数据分析、内容生成、电子邮件自动化等应用程序。
2025-03-05 09:40:06
4768
1
原创 Deepseek+Dify本地知识库相关问题汇总
1,我已经将大部分问题都上传到知识库了,大家有什么问题,先发公众号私信就行,有大模型处理。打开dockerDesktop,点击对应的nginx,可以查看对应的报错日志,有出现。当我们通过应用提问的时候,会从知识库检索出匹配的几个片段,+问题,一起提交给大模型。本地知识库都是存储在本地的,并且都是程序内置的,每隔一个客户端的知识库都是隔离的。2月18日拉取的官方代码,使用docker部署的时候出现的问题,原因。3,因为个人精力有限,后期只回复重复性高的,或比较特殊的问题。
2025-03-05 09:37:53
2018
原创 最轻量级的deepseek应用,支持联网和知识库
最近大家在使用本地化deepseek后,问题比较多,最近我会帮大家一一解决。deepseek本地化部署或者使用api服务没有联网功能历史文章:《国产AI之光!DeepSeek本地部署教程,效果媲美GPT-4》《DeepSeek+本地知识库:真的太香了》 https://mp.weixin.qq.com/s/IKoBga2iKfpkdD4Qgy8iLg?
2025-03-05 09:31:40
1141
原创 DeepSeek+个人神级知识库=王炸
用知识库提问是有技巧的,你是让他整理,还是推导,还是检索。这个提示词就很关键。提示词用不好会出现:ima内部设置了一些提示词,当问题文档未提及时应拒答。万能提示词结构基于知识库里的___帮我___用于__
2025-03-05 09:29:23
2098
原创 DeepSeek+dify 本地知识库:真的太香了
群友一直希望我做一个dify的教程,我把去年的dify铲了,重新安装了一遍。同时以前的文章提问,以及群友的问题,我先做一个知识科普,不感兴趣的可以绕过这块。
2025-03-04 09:42:07
2516
原创 当我把公众号作为知识库塞进了智能体后
1,不带推理功能的大模型真是差强人意2,后续研究下元器里的工作流,使用调用api的方式使用满血DeepSeek-R1模型3,后续把解决的所有问题都放入到问题库里。创作不易,辛苦大家动动发财的小手。if 文章有用:关注() # 🔔 追更最新内容else:留言吐槽() # 💬 评论区等你来战。
2025-02-14 22:34:43
1232
原创 本地DeepSeek下载慢,中断、内网无法安装方案来了
最近在群里有不少人反馈,ollama安装deepseek特别慢,或者多次中断、或者下载不下来。有的是想在内网环境安装,没有网络,我研究了下解决方案。
2025-02-13 10:21:58
1153
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅