自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(369)
  • 收藏
  • 关注

原创 Dify 1.1.0史诗级更新!新增“灵魂功能“元数据,实测竟藏致命Bug?手把手教你避坑

昨天刚吃过饭,看到dify推送1.1.0的升级,我看了下升级日志。在Dify1.1.0版本中修复了,新增了。官方推介的最重要的功能是元数据。

2025-03-31 10:37:23 1099

原创 从8550秒到608秒!RAGFlow最新版本让知识图谱生成效率狂飙,终于不用通宵等结果了

在ragflow的官方中,关于知识图谱,主要有两个文档,主要内容从0.9.0开始引入依赖于大模型和专有数据库infinity主要增强多跳问答和跨文档查询从v0.16.0版本开始,RAGFlow支持在知识库上构建知识图谱文档中的流程图不再依赖infinity想深读了解的,可以看看我们看下耗时对比。版本构建耗时降幅v0.17.08550秒v0.17.11440秒83%↓v0.17.2608秒58%↓​我们可以看到知识图谱的构建是非常花费时间和tokens的。

2025-03-31 10:32:59 567

原创 RAGFlow爬虫组件使用及ragflow vs dify 组件设计对比

上周末,两台电脑都失联了,一个是断网了,一个被我不小心关机。导致我两天没环境。只能整理,学点东西。上周有个有个群友问我ragflow爬虫的没法使用的问题。幸好周六早上的时候实践了下。

2025-03-19 19:43:24 1258

原创 亲测有效!Win10环境下RAGFlow全栈配置教程(附避坑指南)

做环境管理,单一的python还好一些,我之前安装的是3.9(比较早了)。而有些项目需要3.10,有的需要3.11,有的需要3.12,要么升级,要么安装多套环境。不想用uv,使用conda,建议让kimi写个脚本,把uv.lock里的包都洗出来,洗成。如果你没有修改过docker部署的端口,可以直接使用,如果修改了,需要对应的修改。然而我折腾了一会,安装不上。前端环境需要npm,或者pnpm,我之前一直有对应的环境,我就不折腾了。如果大家自己折腾,建议用uv,直接导入官方提供的,缺有,但是不多。

2025-03-17 08:11:57 1952 7

原创 DeepSeek兼容性评估,企业DeepSeek部署配置选择

昨天压测完以后,今天群里的小伙伴讨论的很热烈,有个小伙伴推荐了一个工具。覆盖两个场景。

2025-03-15 13:56:56 899

原创 生产环境vLLM 部署 DeepSeek,如何调优,看这里

vLLM 是一个快速且易于使用的 LLM 推理和服务库。vLLM(VeryLargeLanguageModelServing)是由加州大学伯克利分校团队开发的高性能、低延迟的大语言模型(LLM)推理和服务框架。它专为大规模生产级部署设计,尤其擅长处理超长上下文(如8k+ tokens)和高并发请求,同时显著优化显存利用率,是当前开源社区中吞吐量最高的LLM推理引擎之一。高吞吐量:采用先进的服务器吞吐量技术。内存管理:通过PagedAttention高效管理注意力键和值内存。请求批处理。

2025-03-14 08:33:57 931

原创 模型微调之基础篇:模型微调概念以及微调框架

之前我们一直强调,大语言模型(LLM)是概率生成系统。能力边界知识时效性:模型知识截止于训练数据时间点推理局限性:本质是概率预测而非逻辑运算,复杂数学推理易出错(deepseek的架构有所不同)专业领域盲区:缺乏垂直领域知识幻觉现象:可能生成看似合理但实际错误的内容之前一直讲解如何通过各种不同的知识库进行知识片段的检索,并通过提示词临时注入到大模型。从今天开始,我会写一写微调相关的文章。定义:在预训练大模型(如GPT、BERT)的基础上,使用特定领域或任务的数据进行额外训练,使模型适应新任务。

2025-03-14 08:29:16 914

原创 你们要的dify增强功能都在这里

我们看下基于dify增加了哪些功能。我把官网的介绍截图下来了,大家可以看看。我比较比较关注的几个功能web公开页登录授权,这个功能能保证了发布的应用,必须登录以后才能使用密钥额度设置,这个做好功能以后,可以对外暴露api,进行付费调用费用报表,方便管理者统计需求,也是提效的依据。

2025-03-10 23:00:26 1538

原创 知识库Dify和cherry无法解析影印pdf word解决方案

多格式转换:支持 PDF、图像、PPTX/DOCX/XLSX/HTML/EPUB → Markdown/JSON/HTML复杂内容提取:表格、公式、代码块、链接,支持图像保留与 OCR 修复,适配论文、金融文档等场景。可扩展优化:通过--use_llm调用 Gemini/Ollama 等模型提升准确率,支持自定义处理规则。

2025-03-07 09:50:57 1848

原创 dify外挂ragflow+千问QWQ,解决dify解析和检索短板

之前一直有粉丝留言说让我出一个dify+ragflow的教程,今天来实操下。

2025-03-07 09:42:44 1349 7

原创 OceanBase-obcp-v3考试资料梳理

集群由一个或多个Region组成,Region 由一个或多个Zone组成,Zone由一个或多个OBServer组成,每个OBServer里有若干个partition的Replica。对应物理上的一个城市或地域,当OB集群由多个Region组成时, 数据库的数据和服务能力就具备地域级容灾能力,当集群只有一个Region时,如果出现整个城市级别的故障,则会影响数据库的数据和服务能力;一般情况下对应一个有独立网络和供电容灾能力的数据中心,在一个Region内的多个Zone之间OB数据库拥有Zone故障时的容灾能力

2025-03-06 17:27:52 930

原创 DeepSeek+ragflow构建企业知识库:高级应用篇,越折腾越觉得ragflow好玩

从知识检索测试来说,开启知识图谱的检索效果最好。从聊天效果来说,反而通用的更符合我的口味。我的需求不明确,只是随意拿着一份文档测试,测试没有目标性,只是体验下检索的效果以及差异性,这个需要专业的测试。

2025-03-05 10:02:36 1287 1

原创 DeepSeek+ragflow构建企业知识库之工作流,突然觉的dify又香了

我们按照下图的数据介绍组件。ragflow的的官方文档相对来说还是比较欠缺的,特别是用户交互这块。ragflow的ui使用成本相对比较高,组件不知道返回什么,只能根据示例或意图推断使用ragflow建议是有技术底子的英文文档的描述习惯和中文还是有很大的差别的说实话,用着有点崩溃,哈哈。

2025-03-05 10:01:09 951

原创 DeepSeek+ragflow构建企业知识库:突然觉的dify不香了(1)

从面板上看,就几个功能。还是很清晰,它的模板特别少,在创建agent的时候可以选择。

2025-03-05 09:56:21 1195

原创 聊聊dify权限验证的三种方案及实现

之前在聊一个问题,dify分享出去以后谁都可以用,如果在玩一些有趣的东西的时候,会…

2025-03-05 09:54:56 1700

原创 DeepSeek+dify 工作流应用,自然语言查询数据库信息并展示

在写连接外部数据库查询的时候,我就想普通的业务人员没有编程背景,不懂数据库,可他们想查询统计一些东西怎么办?只能找对应的开发人员写sql了,那我是不是可以用工作流解决这个问题。我把库表结构从数据库里导出一份表结构,导出到相同的文件里,建立一个知识库。里写的python脚本改下,由关键词检索改成sql检索。技术纵深:高并发架构 | 应用调优 | 分布式系统。管理沉淀:8年技术团队管理 | 百万级DAU经验。的阈值不要调太大,一般0.3即可,别看图。作为查询变量,添加刚才添加的数据库知识库。

2025-03-05 09:53:17 2560

原创 DeepSeek+dify知识库,查询数据库的两种方式(api+直连)

最近大家一直在问我一个,怎么让在个ai应用客户端直接连接数据库查询。dify官方没有现成的组件可以直接用。当时我想的是两种方式,一种是基于代码执行模块直接查询数据库,一种是基于Http请求,调用自己封装接口来查询数据库。

2025-03-05 09:51:08 1591

原创 DeepSeek+dify 本地知识库:高级应用Agent+工作流

工作流通过将复杂的任务分解成较小的步骤(节点)降低系统复杂度,减少了对提示词技术和模型推理能力的依赖,提高了 LLM 应用面向复杂任务的性能,提升了系统的可解释性、稳定性和容错性。一个完整的工作流,必须具备开始和结束两个节点。Chatflow:面向对话类情景,包括客户服务、语义搜索、以及其他需要在构建响应时进行多步逻辑的对话式应用程序。Workflow:面向自动化和批处理情景,适合高质量翻译、数据分析、内容生成、电子邮件自动化等应用程序。

2025-03-05 09:40:06 2278 1

原创 Deepseek+Dify本地知识库相关问题汇总

1,我已经将大部分问题都上传到知识库了,大家有什么问题,先发公众号私信就行,有大模型处理。打开dockerDesktop,点击对应的nginx,可以查看对应的报错日志,有出现。当我们通过应用提问的时候,会从知识库检索出匹配的几个片段,+问题,一起提交给大模型。本地知识库都是存储在本地的,并且都是程序内置的,每隔一个客户端的知识库都是隔离的。2月18日拉取的官方代码,使用docker部署的时候出现的问题,原因。3,因为个人精力有限,后期只回复重复性高的,或比较特殊的问题。

2025-03-05 09:37:53 1093

原创 最轻量级的deepseek应用,支持联网和知识库

最近大家在使用本地化deepseek后,问题比较多,最近我会帮大家一一解决。deepseek本地化部署或者使用api服务没有联网功能历史文章:《国产AI之光!DeepSeek本地部署教程,效果媲美GPT-4》《DeepSeek+本地知识库:真的太香了》 https://mp.weixin.qq.com/s/IKoBga2iKfpkdD4Qgy8iLg?

2025-03-05 09:31:40 797

原创 DeepSeek+个人神级知识库=王炸

用知识库提问是有技巧的,你是让他整理,还是推导,还是检索。这个提示词就很关键。提示词用不好会出现:ima内部设置了一些提示词,当问题文档未提及时应拒答。万能提示词结构基于知识库里的___帮我___用于__

2025-03-05 09:29:23 1291

原创 DeepSeek+dify 本地知识库:真的太香了

群友一直希望我做一个dify的教程,我把去年的dify铲了,重新安装了一遍。同时以前的文章提问,以及群友的问题,我先做一个知识科普,不感兴趣的可以绕过这块。

2025-03-04 09:42:07 1422

原创 当我把公众号作为知识库塞进了智能体后

1,不带推理功能的大模型真是差强人意2,后续研究下元器里的工作流,使用调用api的方式使用满血DeepSeek-R1模型3,后续把解决的所有问题都放入到问题库里。创作不易,辛苦大家动动发财的小手。if 文章有用:关注() # 🔔 追更最新内容else:留言吐槽() # 💬 评论区等你来战。

2025-02-14 22:34:43 886

原创 本地DeepSeek下载慢,中断、内网无法安装方案来了

最近在群里有不少人反馈,ollama安装deepseek特别慢,或者多次中断、或者下载不下来。有的是想在内网环境安装,没有网络,我研究了下解决方案。

2025-02-13 10:21:58 792

原创 DeepSeek+本地知识库:真的太香了(修订版)

整个操作下来,AnythingLLM 的体验没有cherry好。AnythingLLM就像一个包壳的web应用(后来查了下,确实是)。AnythingLLM 得具备一定的程序思维,给技术人员用的。非技术人员还是使用cherry吧。作为喜欢折腾的开发人员,我们可以结合dify使用。个人知识库+本地大模型的优点隐私性很好,不用担心自己的资料外泄、离线可用在工作和学习过程中对自己整理的文档,能快速找到,并自动关联在代码开发上,能参考你的开发习惯,快速生成代码创作不易,辛苦大家动动发财的小手。

2025-02-12 20:30:49 1063

原创 DeepSeek+本地知识库:真的太香了

DeepSeek+本地知识库:真的太香了

2025-02-11 18:21:42 1118

原创 为什么redis的zset用跳跃表而不用b+ tree?

redis设计本身使用的是极简思想,跳跃表的操作,比二叉树简单,不需要考虑平衡,实现起来也简单,我觉的这个是重点redis是纯内存操作,不需要考虑磁盘IO的次数(一个*header可以理解为一个数据页,只不过是在内存里)MySQL为了持久化,需要考虑磁盘IO,利用数据页,系统缓存,减少磁盘的操作顺序如果这个问题反过来就好解释了,MySQL为什么用B+Tree 而不用跳表层低,磁盘IO少性能稳定平衡到达每一个叶子节点的路径都固定就上面的两个,实现复杂度高了也无所谓。

2023-02-21 09:58:39 2773

原创 数据库分库分表

随着业务的发展,单库单表难以满足我们对性能的要求,在分库之前,可能我们经历了sql调优、索引优化、数据库参数优化、读写分离、使用分布式缓存来降低我们数据库的压力。但是随着业务再一步扩大,以上的方法可能就不适用了;

2022-12-16 10:30:57 1702

原创 OceanBase-安装

安装oceanbase4.0

2022-12-13 16:14:21 6174

原创 OceanBase-概述

前段时间学习了下tidb的体系架构,了解了其运行原理;今儿了解下OceanBase;先看下官网:https://www.oceanbase.com/在OceanBase的产品分类里,一共有三大块,分布式数据库、工具体系、生态产品;(一个产品好不好用周边很关键);介绍:兼容 MySQL 的单机分布式一体化数据库,具有原生分布式架构,支持金融级高可用、透明水平扩展、分布式事务、多租户和语法兼容等企业级特性。OceanBase 内核通过大规模商用场景的考验,已服务众多行业客户;面向未来携手社区生态伙伴,共建开源开

2022-12-07 19:14:52 4450

原创 MySQL体系-日志与MVCC(源码层面)

通过本文章,可以详细的了解下MySQL中的各种常见日志以及MVCC

2022-11-26 19:38:38 1471

原创 MySQL体系-MySQL架构

先放一张图:[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-I9Sn5jiJ-1665728445419)(https://mmbiz.qpic.cn/mmbiz_png/AaKTtPGkoWKeNnaiawcAKehCXnveVAEzQf2utSOeOG1X12ibybibUsHxvz9bQGr1oKTiaYwZhicicDxTplfF6MWf36Lg/640?wx_fmt=png)]引用自:https://dev.mysql.com/doc/refman/8.0/en/p

2022-10-14 14:21:37 724

原创 redis序列化协议RESP

在阅读redis的源码的时候,一直忽略了一个问题,redis的通信协议,今天就来简单的了解下。

2022-09-02 18:47:38 474

原创 redis源码阅读-主从复制增量复制细节

通过本文了解redis主从复制增量复制的细节,

2022-08-26 11:12:56 384

原创 一道任务编排服务面试题解析

通过本文,你可以了解,如何设计一个任务编排服务。

2022-08-25 10:13:34 352

原创 状态机+策略在工单流转里的使用

可编排状态机在工单系统里的使用。

2022-08-24 09:35:09 939

原创 可编排策略在交易系统的应用

本文主要讲述如何通过重构赋能业务。

2022-08-23 09:37:50 649

原创 redis详解(内部分享版)

在高并发的应用中,缓存是必不可少的,redis是应用比较广泛的,从底层原理,数据结构了解下它。

2022-08-04 11:42:56 1157

原创 redis源码阅读-zset

前段时间给小伙伴分享redis,顺带又把redis撸了一遍了,对其源码,又有了比较深入的了解。(ps分享的文章再丰富下再放出来)。

2022-07-31 12:37:39 624

原创 InnoDB存储引擎存储结构详解-实战篇

本文通过innodb_ruby,来拆解InnoDB在表空间的纯结构,通过本文,希望你能深入了解下InnoDB的数据结构

2022-07-28 19:33:12 866

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除