- 博客(96)
- 资源 (22)
- 收藏
- 关注
原创 针对PDF文档:印章、数字签名、编辑保护、PDF/A的Java工具类
进行pdf文档的印章、数字签名、编辑保护、pdf/a的转换等操作。本方法依赖 pdfbox 3.0.2版本,并且引入bcprov-jdk15on、bcpkix-jdk15on处理数字签名中的证书部分。
2024-06-11 13:57:48
595
原创 转换Html(富文本编辑器)到docx的Java工具类
进行富文本编辑器内容转换为word。依赖 poi 4.1.2版本,支持HTML中存在三方的图像URL。
2024-06-11 13:56:35
763
原创 [图数据库]Neo4j中心性算法-以红楼梦为例
由于作者使用的是 Neo4j 3.5版本,所以引入了插件进行了增强,如果是较新的版本,引入的插件包发生了变化,本文不做过多介绍。本文对中心性算法: 度中心度、紧密中心度、中介中心度、特征向量中心度 分别进行了介绍。使用Neo4j的graph-algorithms-algo插件,调用了针对红楼梦人物关系数据的四种中心度算法。
2024-06-06 15:36:02
536
原创 LLM-结合三元组SPO和提示工程来试用Baichuan2-7B-Chat-4bits模型
LLM-结合三元组SPO和提示工程来试用Baichuan2-7B-Chat-4bits模型》近期对LLM进行了一些应用场景的思考,其中很简单的一个场景是客服,假设目前所有的知识信息都在一个Excel文档中,首先将其转换为三元组关系,然后结合提示工程技术向LLM进行提问,期望得到反馈。百川的Baichuan2-7B-Chat-4bits量化模型,在实际部署的时候,显存占用10G左右,略高于其他人的实验结果,对消费级显卡也有一定要求。
2024-05-13 08:57:30
368
原创 Lucene环境下基于NGram分词的中文高级检索
当前高级检索的实现思路为:按照搜索条件的顺序,一个条件一个条件的添加搜索条件。比如: (A must B should C must D)代表 ((A与B)或C)与D)。本文是在中文环境下,基于Lucene搜索引擎的NGram分词器,实现的高级检索功能,配合多种不同形式下的搜索条件进行检索。接下来列举多种搜索条件,并且返回搜索条件下匹配的搜索结果和针对title字段的搜索结果高亮展示。列出如何将HighSearchDTO对象集合转换为Lucen的Query搜索对象.
2024-04-27 11:50:15
295
原创 EasyExcel导出-自适应图像尺寸
EasyExcel导出-自适应图像尺寸》最近在使用EasyExcel进行图像数据导出的时候,需要在单元格内自适应缩放图像,防止图像被拉伸。
2024-04-27 09:38:10
1040
1
原创 [图数据库]gStore1.2在Ubuntu和Java环境下的安装与试用
gStore这款面向大规模知识图谱应用的原生图数据库系统,本文基于Ubuntu22.04,进行安装和基于Java语言的试用。目前来看,gStore在非企业版使用过程中相比Neo4j仍缺少比如路径查询等方法的支持,但是基本的数据查询和展示能满足绝大部分需求。
2024-04-18 11:24:44
492
原创 思考-使用JSON结构映射业务数据与数据库表结构
思考-使用JSON结构映射业务数据与数据库表结构》,本文提供了一种通过JSON结构映射表结构与业务数据关系,从而进行增删改查操作的技术实现。在进行实现之后,发现此实现在真实业务场景中使用的意义并不大,很少有特别匹配的业务场景,故本文不涉及具体实现,只涉及设计思路。第一步设计某一个业务场景需要映射到哪几张数据库表结构的哪几个字段,第二步举出此业务场景对应的业务数据结构,第三步对数据解析至可以进行DB操作。
2024-04-11 13:50:55
366
原创 基于YOLOV8的自定义数据集实现水印检测
基于Yolo,使用自定义数据集,标注数据集中的水印区域,训练模型后进行测试,得到标注结果。本文使用源码详见基于YOLOV8的自定义数据集实现水印检测。
2024-04-11 13:48:22
1179
原创 图像处理-Java-OpenCV-水印编码/解码
使用JAVA+OpenCV实现基于离散余弦变换(DCT)的水印编码/解码功能,将水印隐藏到图像中,从而可以达到类似版权保护的要求。
2024-04-11 13:47:18
484
原创 图像处理-Java-以图搜图
使用JAVA语言实现,实现思路是使用opencv获得图像的特征,之后将图像特征存入lucene后使用KnnVectorQuery进行搜索,从而达到以图搜图的效果。
2024-04-11 13:46:09
1308
1
原创 图像处理-Java-字深字浅
使用JAVA语言实现,实现思路是获得图像的边缘,判断边缘部分与白色像素点的相似度,对得到的边缘像素点在原始图像上进行像素点的调整(添加/减少),从而实现边缘部分的变深/变浅操作。
2024-04-11 13:45:02
370
原创 一种Java语言下生成竖版表格文档的方法
一种Java语言下生成竖版表格文档的方法》本文是基于Java语言,引入POI从而生成竖版表格文档的方法,文字方向是竖向,本文仅做单元测试方法的分享。
2024-04-11 13:43:59
234
原创 一种Java语言下的简单重试实现
本例支持指定次数的重试,并且设定在多次重试的时间间隔。/*** 重试 工具类* @param maxRetries 最大重试次数·* @param delayMillis 延迟时长* @param task 任务 () -> performOperation() 任务会抛出异常。* @returntry {// 增加重试计数 retryCount ++;// 等待一段时间后进行重试 waitBeforeRetry(delayMillis);} else {
2024-04-11 13:43:26
157
原创 思考-RBAC中对于权限编码部分的压缩处理(RoaringBitmap)
思考-RBAC中对于权限编码部分的压缩处理(RoaringBitmap)》前期编写了思考-RBAC中对于权限编码部分的压缩处理,其中关于Bitmap的部分近期又做了思考,经过资料查阅,本文针对 RoaringBitmap 进行概述。
2024-04-11 13:42:52
179
原创 图像处理-Java-TIFF转换JPG
使用JAVA语言实现,将给定的TIF格式的图像转换为JPG,其中TIF格式的图像有两种,一种是未经过压缩的,另一种是经过 LZW 压缩的。本文提供两个函数对其进行分别处理。
2024-04-11 13:42:16
790
原创 [杂谈]IDE-idea-可执行JAR项目创建
近期总结了前段时间的一个桌面应用开发的场景,想到多年前在没有Maven的时候,也同样进行过开发,想回过头来对比一下,故编写此文,使用 IDEA 这个 IDE 创建一个简单的项目,并打包成可执行JAR,本例无技术难点,仅做一个记录。
2024-04-11 13:40:29
306
原创 Excel复杂表头按组按行复制
Excel复杂表头按组按行复制》在ERP软件中将数据导出为复杂表头的Excel,本例采用模板替换的思路,先将所有单元格生成,之后进行单元格替换。
2024-04-10 16:35:06
340
原创 图像处理-Java-指定大小压缩
使用JAVA语言实现,将给定的JPEG图像文件调整到指定的目标文件大小,使用循环,不断地调整图像质量,然后保存图像并检查文件大小是否达到目标大小。
2024-04-10 16:34:19
378
原创 [分词]基于Lucene8版本的逆向最大匹配分词器(依赖本地词典
在搜索相关业务场景中,强依赖中文分词的结果,本文是基于Lucene8版本的混合分词器(分词合并)的补充,可以将自定义分词的结果进行添加。此代码在Lucene8.6.2版本下通过测试,对中文分词补充基于逆向最大匹配的分词结果,从而提升质量。
2024-04-10 16:33:28
359
原创 动态规划-序列比对-最长公共子序列
输入两个字符串ABCBDAB和BDCAB,输出最长公共子序列BDAB,并且最长公共子序列在左侧字符串中的位置是[2,5,6,7],在右侧字符串中的位置是[1,2,4,5]。进行了实现,并达到了业务要求。基于类似的业务场景,作者思考有没有其他的方案:故了解最长公共子序列LCS算法并进行本文的编写。假设有如下两个字符串,对这两个字符串进行比对,得到最长公共子序列,并且包含每个字符在原始字符串中的位置。近期遇到一些关于字符串比对的业务需求,并通过。
2024-04-10 16:32:26
486
原创 动态规划-序列比对-Smith-Waterman
进行了实现,并达到了业务要求。基于类似的业务场景,作者思考有没有其他的方案:故了解Smith-Waterman 算法并进行本文的编写。假设有如下两个字符串,对这两个字符串进行比对,并设置一系列的参数,可以得到一系列相似子串。输入两个字符串,在限制参数的情况下,输出三组相似的子串,其中-代表差异。近期遇到一些关于字符串比对的业务需求,并通过。
2024-04-10 16:31:42
620
原创 [分词]基于Lucene8版本的JSON结构分词器(属性值集合)
在实际场景中,不排除将JSON字符串存储至Database中,并且现有的绝大部分数据库都支持了JSON结构,但是在将关系型数据库中的数据索引至Lucene的时候,针对JSON结构需要进行额外的处理。此代码在Lucene8.6.2版本下通过测试,采用自定义JSON分词器的方式,对JSON结构的数据提升支持力度。
2024-04-10 16:30:56
280
原创 思考-RBAC中对于权限编码部分的压缩处理
思考-RBAC中对于权限编码部分的压缩处理》近段时间重新学习了一下压缩算法,突然想到在平时的程序设计中能否对其进行应用,进而想到最基础的RBAC权限设计,可否将大量的一对多的关联关系部分数据进行压缩,本文介绍只是一种思路,作者并未在真实环境对此进行应用。
2024-04-10 16:30:12
408
原创 集合-Java-笛卡尔积、平铺
集合-Java-笛卡尔积、平铺》本文是关于对集合进行笛卡尔积操作、平铺操作的示例,技术层面并不复杂,故不过多进行介绍。
2024-04-10 16:28:31
518
原创 图像处理-Java-背景色平滑/反色
使用JAVA语音实现,实现思路是通过识别背景色并将接近背景色的像素进行平均处理,以减少图像中颜色的突变。分为如下步骤:1、颜色计数:2、背景色查找:3、平滑处理:4、颜色接近判断:5、获取平均颜色:6、替换图像。
2024-04-10 16:26:09
307
原创 图像处理-Java-去噪/高斯模糊/套红
使用JAVA语音实现,实现思路是非局部均值(Non-Local Means, NLM)去噪方法。通过在图像中寻找相似的像素块,并使用加权平均的方式对这些块进行处理,从而达到去除噪声的效果。
2024-04-10 16:25:22
483
原创 图像处理锐化-Java-Prewitt算子叠加
使用JAVA语音实现,实现思路是首先使用Prewitt算子获得图像边缘,之后就可以将边缘信息与原图进行叠加处理来锐化图像。
2024-04-10 16:24:33
481
原创 优化-Spring Boot项目服务端接口超时设置
成本最低的解决方案是使用 @Transactional(timeout = 5) 注解,此方案不需要做额外的改动,可以快速增加服务端的超时设置,并且保证前后端理解一致。
2024-04-10 16:23:28
968
原创 字符串操作-逗号分割字符串转树形结构
字符串操作-逗号分割字符串转树形结构》近期一直在进行中文领域开源数据集的预处理操作,其中有一系列方法完全可以抽离出来,本文就介绍了了一种将逗号分割的字符串集合转为树形结构的方式,用来将开源数据集中的平铺数据结构转为树形,将无层级结构的数据转为层级结构。首先现将原始的字符串集合转为平铺形式的树形结构集合,之后将平铺的属性结构集合使用递归方式构造成树形结构。
2024-04-10 16:22:45
511
原创 Excel数据转换为一对多的工具类
此方法分别传入 head-excel、detail-excel对应的文件绝对路径和sheetName,之后设定两个sheet对应的字段关联关系,本例是将 ‘订单编号-收货人-收货电话’ 一起当做两个sheet的业务关联字段,之后设置 顺序号和一对多的字段名称。《Excel数据转换为一对多的工具类》在ERP类的软件中,会存在大量的Excel导入导出功能,本文提供一种工具,将Excel中多个Sheet中的数据,转换为一对多的关系,并且支持自定义关联的关联关系设定。
2024-04-10 16:22:07
490
原创 替代关系型数据库 MAX 聚合函数的思路
替代关系型数据库 MAX 聚合函数的思路》,在报表数据查询的场景中,有时候会需要在类似日志表中查询指定条件下的最新数据,一般的思路是先通过 select max(id) from table group by bus_key 查询到最新的数据,然后外部再包装一个查询语句。针对从类似日志表中查询最新的一条数据,可以使用自关联查询的方式,直接把最新的数据查询出来,避免使用 max 函数。提供了两组查询语句,实现的是同样的业务逻辑,唯一的区别在于多了一个过滤条件,相当于多个不同的分组,具体实现可以看下属语句。
2024-04-09 09:56:48
286
原创 JavaFx项目至安装程序
分为两步,第一步是先将程序转为可执行EXE,但是这一步仍需要单独安装Java环境,第二步是将EXE转为安装程序,将JRE打进安装程序,不需要再单独安装JAVA环境。2016-2017年的时候,使用JavaFX做过客户端,最近需要在此基础上,打出来一个安装程序,本文不牵扯任何技术,只做记录。
2024-04-09 09:55:59
303
原创 图像边缘检测 - 去黑边 -JAVA
使用JAVA实现Canny边缘检测算法,针对一直输入图像,先进行边缘检测,之后基于边缘检测的结果,完成图像的去黑边操作。
2024-04-09 09:51:00
637
原创 [分组聚合]基于Lucene8进行多值字段分组聚合(多属性字段)
在使用搜索引擎的过程中,经常会出现针对属性进行分组聚合的场景,单属性分组聚合很简单,如何对多属性字段进行分组聚合是本文的重点。此代码在Lucene8.6.2版本下通过测试,从而高效的获取到单字段多属性的分组聚合结果。
2024-04-09 09:48:07
390
学生成绩管理系统~ado mfc vc6.0
2010-11-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人