- 博客(31)
- 资源 (2)
- 收藏
- 关注
原创 Dify智能体平台源码二次开发笔记(7) - 优化知识库pdf识别(2)
补充前篇的一些优化。场景是识别pdf文档,但还需要把pdf文档中的图片也保存下来,在知识库增强检索的时候,直接可以显示图片。
2025-04-16 16:04:45
26
原创 Dify智能体平台源码二次开发笔记(6) - 优化知识库pdf文档的识别
dify的1.1.3版本知识库pdf解析实现使用pypdfium2提取文本,主要存在以下问题:1. 文本提取能力有限,对表格和图片支持不足。2. 缺乏专门的中文处理优化。3. 没有文档结构分析。4. 缺少文档质量评估。建议优化方案:1. 使用pdfplumber替代pypdfium2。2. 增加OCR支持 。3. 优化中文处理逻辑。4. 添加文档结构分析。5. 实现智能表格识别。6. 增加缓存机制。7. 优化大文件处理
2025-04-16 13:30:03
219
原创 Dify智能体平台源码二次开发笔记(5) - 多租户的SAAS版实现(2)
完成租户添加功能后,下一步需要实现租户下的用户管理。基础功能包括:查询租户用户列表接口,添加用户接口
2025-04-14 15:21:29
340
原创 Dify智能体平台源码二次开发笔记(4) - 多租户的SAAS版实现
Dify 的多租户功能是其商业版的标准功能,我们应当尊重其盈利模式。只有保持良性的商业运作,Dify 才能持续发展,并为用户提供更优质的功能。因此,此功能仅限学习使用。我们的需求是:实现类似 SaaS 版的账号隔离,包括智能体、知识库、插件和模型配置等模块的完全隔离。为此,需要启用多租户功能。
2025-04-14 10:08:16
453
原创 Dify智能体平台源码二次开发笔记(3) - 智能体API的三方验证集成
本文记录了Dify智能体平台源码二次开发中API安全验证的改造过程。针对前端直接调用API的安全隐患,我们重构了默认的API Key验证方式,通过集成三方平台登录token实现双重认证。文章详细介绍了如何改造wraps.py核心验证逻辑,将原有简单的API Key验证升级为"Bearer 智能体名+三方token"的复合验证模式,并保持与Redis缓存验证的集成,最终在不影响性能的前提下显著提升了API调用安全性。
2025-04-12 14:53:32
283
原创 Dify智能体平台源码二次开发笔记(2) - 源码调试、打包及部署指南
本文记录了Dify智能体平台源码二次开发过程中的关键环节,重点介绍调试配置、镜像构建与部署实施的具体操作。文章详细说明了本地调试所需的环境变量配置,包括缓存、数据库、文件存储、向量数据库等服务的连接参数。在构建环节,提供了从源码编译Docker镜像到推送至Harbor私有仓库的完整操作流程。最后简要说明了使用Docker Compose部署更新后的服务,帮助开发者快速将二次开发成果投入实际应用环境。本文为后续结合具体场景的功能开发奠定了基础
2025-04-12 13:47:28
913
原创 Dify智能体平台源码二次开发笔记(1) - 分布式服务部署优化版
本文详细介绍了Dify智能体平台的源码二次开发与分布式服务部署方案,重点阐述了核心架构配置与关键优化点。主要内容包括主服务模块(API/Worker/Web)和辅助服务(Sandbox/Plugin Daemon)的部署方式,以及Redis、PostgreSQL、Milvus和MinIO等关键中间件的配置方法。特别强调了将默认的Weaviate向量数据库替换为支持十亿级数据的Milvus,文件存储从本地升级为MinIO分布式存储的优化方案,并提供了Nginx反向代理配置示例。文章还列出了必须开放的服务端口清
2025-04-12 13:07:41
639
原创 用FastDFS一步步搭建文件管理系统
用FastDFS一步步搭建文件管理系统 一、FastDFS介绍FastDFS开源地址:https://github.com/happyfish100参考:分布式文件系统FastDFS设计原理 参考:FastDFS分布式文件系统个人封装的FastDFS Java API:https://github.com/bojiangzhou/lyyzoo-fastdfs-java...
2018-11-20 13:21:11
261
原创 maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9,注意maven2和maven1有很大区别,阅读第三方文档时需要区分版本。 1.2. Maven资源 见官方网站;The 5 minute test,官方简易入门文档;Getting St
2015-05-12 16:31:35
395
原创 Cordova 环境配置
Mobile App分为三大类:Native App,Hybrid App,Web App。其中Hybrid App介于Native App和Web App之间,它能兼顾Native App的良好用户体验及强大的功能并具有Web App跨平台快速开发的优势。缺点在于依赖于各平台的WebView,WebView的性能好坏直接决定了Hybrid App的性能。目前国内外的Hybri
2015-01-15 21:56:51
1355
转载 e搭建SSH框架
SSH框架是最常用的框架之一,在搭建SSH框架的时候总有人遇到这样,那样的问题。下面我介绍一下SSH框架搭建的全过程。 第一步:准备工作。 下载好eclipse,Struts2,Spring,Hibernate。 1.eclipse:eclipse下载的时候建议下载JavaEE版的eclipse。 当然你也可以下载eclipse-SDK。(下
2014-08-11 08:53:21
511
原创 Nginx+tomcat
一、安装Tomcat和JDK1、上传apache-tomcat-6.0.18.tar.gz和jdk-6u12-linux-i586.bin至/usr/local2、执行如下命令安装tomcat:#cd /usr/local#tar zxvf apache-tomcat-6.0.18.tar.gz 解压完成后将apache-tomcat-6
2014-07-28 09:31:23
444
转载 并发框架Disruptor
Martin Fowler在自己网站上写了一篇LMAX架构的文章,在文章中他介绍了LMAX是一种新型零售金融交易平台,它能够以很低的延迟产生大量交易。这个系统是建立在JVM平台上,其核心是一个业务逻辑处理器,它能够在一个线程里每秒处理6百万订单。业务逻辑处理器完全是运行在内存中,使用事件源驱动方式。业务逻辑处理器的核心是Disruptor。Disruptor它是一个开源的并发框架,并获
2014-04-10 08:53:14
452
原创 C# socket编程从入门到精通
虽然天天上博客园欣赏各位“大侠”的杰作,偶然回首,突然发现自己已成“潜水者”久矣。本来对于自己有限的水平,有点不好意思在此发贴,不过潜伏久了,才慢慢意识到老是通过浏览他人的文章虽然能够提高自己能力,能够及时的获取新技术新思想,但却只能停留在他人的思想上。通过学习,加上自己的想法,再写出来,让大家来指证错误,不仅能够巩固自己的知识,也可以让一些跟我一样迷惘的朋友们不用再去走一些弯路,岂
2014-02-27 08:13:49
1204
转载 安装和使用memcached
如何将 memcached 融入到您的环境中?在开始安装和使用 using memcached 之前,我们需要了解如何将 memcached 融入到您的环境中。虽然在任何地方都可以使用 memcached,但我发现需要在数据库层中执行几个经常性查询时,memcached 往往能发挥最大的效用。我经常会在数据库和应用服务器之间设置一系列 memcached 实例,并采用一种简单的模式来读取和写入
2013-09-29 09:56:13
382
原创 eclipse 转myeclipse 项目
修改工程文件 .project 里面添加:org.eclipse.wst.common.project.facet.core.nature org.eclipse.wst.common.modulecore.ModuleCoreNature org.eclipse.jem.workbench.JavaEMFNature 里面添加: org.eclip
2013-09-27 09:08:09
509
转载 centos之计划任务(cron)
cron是一个linux下的定时执行工具,可以在无需人工干预的情况下运行作业。由于Cron 是Linux的内置服务,但它不自动起来,可以用以下的方法启动、关闭这个服务: /sbin/service crond start //启动服务 /sbin/service crond stop //关闭服务 /sbin/service crond restart //重启服务 /sbin/s
2013-09-22 14:01:01
593
原创 centos 防火墙
#/sbin/iptables -I INPUT -p tcp --dport 80 -j ACCEPT #/sbin/iptables -I INPUT -p tcp --dport 22 -j ACCEPT 然后保存: #/etc/rc.d/init.d/iptables save 再查看是否已经有了: [root@vcentos ~]# /etc/init.d
2013-09-04 09:20:47
514
原创 centos 解压 tar命令
tar [-cxtzjvfpPN] 文件与目录 ....参数:-c :建立一个压缩文件的参数指令(create 的意思);-x :解开一个压缩文件的参数指令!-t :查看 tarfile 里面的文件!特别注意,在参数的下达中, c/x/t 仅能存在一个!不可同时存在!因为不可能同时压缩与解压缩。-z :是否同时具有 gzip 的属性?亦即是否需要用 gzip 压缩?
2013-09-02 09:17:14
968
原创 centos下读取某个文件的头几行或末几行
读取头部,使用命令head。 如命令:head filename 默认显示文件 filename 的前十行内容;若希望显示文件的前二十行内容,使用命令:head -n 20 filename 若-n后面的整数为负数时,如head -n -20 filename,则表示列出除尾部的20行外的所有行。读取尾部,使用命令tail,使用方法同h
2013-08-05 13:54:54
760
原创 CentOS 6.2下搭建 php 服务器
CentOS是企业Linux发行版领头羊Red Hat Enterprise Linux(以下称之为RHEL)的再编译版本,RHEL是很多企业采用的linux发行版本,需要向RedHat付费才可以使用,并能得到付过费用的服务和技术支持和版本升级。这个CentOS可以像REHL一样的构筑linux系统环境,但不需要向RedHat付任何的费用,同样也得不到任何有偿技术支持和升级服务。 由于出
2013-07-30 13:00:23
582
转载 centos rpm 命令参数使用详解
rpm 执行安装包二进制包(Binary)以及源代码包(Source)两种。二进制包可以直接安装在计算机中,而源代码包将会由RPM自动编译、安装。源代码包经常以src.rpm作为后缀名。常用命令组合: -ivh:安装显示安装进度--install--verbose--hash-Uvh:升级软件包--Update;-qpl:列出RPM软件包内的文件信息[Query Pac
2013-07-12 08:45:23
1555
原创 linux下mysql的root密码忘记
1.首先确认服务器出于安全的状态,也就是没有人能够任意地连接MySQL数据库。 因为在重新设置MySQL的root密码的期间,MySQL数据库完全出于没有密码保护的 状态下,其他的用户也可以任意地登录和修改MySQL的信息。可以采用将MySQL对 外的端口封闭,并且停止Apache以及所有的用户进程的方法实现服务器的准安全 状态。最安全的状态是到服务器的Console上面操作,并且
2013-07-03 11:09:34
405
原创 GraphicsMagick+im4java实现高质量大图的处理
做网站往往需要处理各种各样的图片,对于jdk自带的一套图片处理库,他的特点是稳定简单,但是对图片处理来说,性能确实很不咋的! 于是我转向了以C++处理为核心的java处理包—— JMagick+ ImageMagick 。jmagick是一个开源的API,利用JNI(Java Native Interface)技术实现了对ImageMagickAPI 的Java访问接口,因此也将
2013-07-02 11:05:58
1756
原创 LoadRunner 教程,备忘
第一部分:LoadRunner入门教程常见问题LoadRunner关联详解参数迭代规则详解监控oracle数据库loadrunner走下神坛测试oracle 10g时遇到的问题在LoadRunner脚本中做关联性能测试经验总结一个简单的测试参数化功能详解使用集合点进行测试做功能测试自动化一些小知识总结使用集合点进行功能测试常用函数选项设置第二部分:LoadRun
2013-07-02 11:00:57
1598
转载 Lucene使用教程
Lucene-3.0.0配置一、Lucene开发环境配置 step1.Lucene开发包下载 step2.Java开发环境配置 step3.Tomcat安装 step4.Lucene开发环境配置 解压下载的lucene-3.0.0.zip,可以看到lucene-core-3.0.0.jar和lucene-demos-3.0.0.jar这两
2013-07-02 10:32:17
960
原创 分布式缓存系统memcached简介与实践
memcached是什么?memcached是由Danga Interactive开发的,高性能的,分布式的内存对象缓存系统,用于在动态应用中减少数据库负载,提升访问速度。memcached能缓存什么?通过在内存里维护一个统一的巨大的hash表,Memcached能够用来存储各种格式的数据,包括图像、视频、文件以及数据库检索的结果等。memcached快么?非常快。memcac
2013-07-02 10:25:09
493
原创 openfire开发文档
目 录一、初始工作····································21、安装jdk1.52、安装eclipse,myeclipse3、安装oracle10gXE4、安装openfire3.5.1源代码二、环境配置····································1、配置java环境2、配置openfire运行环境三、
2013-07-02 09:00:48
1028
原创 用ftp创建批处理备份网站数据
1.建立a.bat,其内容如下:ftp -s:ftp.txt2.同时建立ftp.txtopen 123.45.14.41 登录username 用户名password 密码cd wwwroot 进入服务器上目录lcd e:\test\upload 锁定本地目录mkdir test 在服务器建立目录prompt 去掉提示mput e:\test\*.* /te
2013-07-01 08:53:56
500
转载 apache tomcat 集群 和 负载均衡
准备环境ApacheApache是http服务器,我们利用其对Tomcat进行负载均衡。目前最新版本为2.2.17,下载地址为http://httpd.apache.org/download.cgi#apache22。如下图: 目前已经出现Apache2.3.11,但是为beta版本,所以没有使用。下载后直接安装msi即可,如果没有其他的http服务器(如iis)则应该可以
2013-07-01 08:47:28
485
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人