- 博客(42)
- 收藏
- 关注
原创 从章节分割到多粒度 RAG:小说检索增强完整实战(附代码示例)
本文介绍了面向中文长篇小说的RAG增强检索方案,针对章节分割粒度粗、召回质量差等痛点,提出多阶段优化策略。基础章节分割示例展示了简单分割的局限,进而提出多粒度索引、Hybrid混合检索、Rerank重排序等增强方法,包括窗口分块、关键词抽取、上下文桥接等技术细节。文章还提供分阶段实施建议和质量评估指标,最终实现精准、连贯的小说问答系统。完整方案涵盖从数据处理到结果可信的全流程优化。
2025-11-04 09:53:57
915
原创 HanLP 1.x 终极上手指南:从 Maven 坐标到自定义词典,一篇就够!
本文介绍了HanLP在中文自然语言处理中的应用,重点针对生产环境中的常见问题进行优化。内容包括:极速入门指南、功能全景图(分词、词性标注、NER等)、5种自定义词典方法、性能调优checklist、10个常见问题解决方案、1.x与2.x版本对比,以及Docker部署方案。文章强调1.x版本在工业场景下的优势,提供从基础使用到生产调优的完整指导,帮助开发者将Demo代码升级为稳定可靠的工业级实现。
2025-10-24 11:01:31
965
原创 Neo4j 版本选型与 Java 技术栈深度解析:Spring Data Neo4j vs Java Driver,如何抉择?
本文对比了Java生态中操作Neo4j图数据库的两大主流方案:Spring Data Neo4j(SDN)和Neo4j Java Driver。SDN适用于Spring Boot项目,提供对象映射和自动查询生成,开发效率高但性能稍逊;Java Driver则提供底层Cypher控制,灵活性高且性能优异,适合复杂查询和非Spring项目。文章给出版本选型建议(推荐Neo4j 5.x)、核心特性对比和混合使用策略,帮助开发者根据项目需求(如开发效率、性能要求、框架集成等)选择最合适的方案。
2025-10-23 16:00:49
809
原创 从零开始:Neo4j图数据库安装、使用与Java SDK集成全攻略
10分钟入门Neo4j!手把手教你把图数据库装进Docker,Spring Boot 3行代码秒连,性能飙到百万QPS!内附版本避坑清单+生产级调优秘籍,Java党收藏这篇就够了→
2025-10-23 15:50:28
677
原创 深度实测|四大名著语义检索:text2vec-base-chinese vs bge-large-zh-v1.5——谁更快?谁更准?
本文对比了text2vec-base-chinese和bge-large-zh-v1.5两个中文Embedding模型在四大名著上的表现。测试分为嵌入性能和语义检索两个阶段:text2vec在嵌入速度上优势明显(平均耗时仅为bge的45%),而bge在红楼梦等情感类文本上召回率略高。整体来看,text2vec更适合快速构建向量底座,bge则适合精细化场景。研究还发现,分块策略对text2vec性能影响更大,且两个模型输出的向量都已归一化。最终四书宏均值显示,text2vec在Top1召回率上以1.3%的微弱
2025-10-23 14:46:17
1223
原创 零成本打造本地多引擎大模型与向量服务:Xinference 全栈部署 + 性能调优实战
本文介绍了Xinference框架的部署与应用,涵盖推理引擎选择、安装配置、模型管理与调用等关键环节。Xinference支持多引擎统一(vLLM/SGLang/llama.cpp等),提供OpenAI兼容API,便于现有项目迁移。文章详细展示了Embedding模型的管理流程、REST API调用示例,以及LLM模型(如qwen2.5-instruct)的启动与交互方法,同时介绍了集群部署模式和CLI管理工具,为开发者构建本地/内网的"LLM+向量+会话"协同系统提供实践指导。
2025-10-22 13:53:21
1380
原创 RAG 增强与向量基础篇:继续搭建“模型 + 向量 + 会话 + 工具”协同底座
本文介绍了企业级AI框架LangChain4j+SpringAI的升级功能,聚焦四个核心能力:Embedding模型管理、向量存储接入、RAG服务配置与检索、以及会话与RAG/MCP联动。新增功能使系统从基础对话升级为"知识增强+工具协同"的复合智能单元,支持向量化文档索引、语义检索与多服务组合调用。文章详细展示了各模块配置界面,包括Embedding模型维度约束测试、Qdrant向量库连接、RAG服务分块策略等,并提供了系统扩展路线图,涵盖多文件类型支持、权限过滤、成本优化等企业级需求
2025-10-22 11:18:05
1561
原创 RAG 21种通用分割策略初次尝试总结
本文总结了从21种通用分块策略出发构建通用RAG文本分块体系的探索。研究发现,这些策略更像是"原型分类表"而非可直接落地的方案,需结合领域特化才能有效应用。实践实现了8个基础策略模块(Tier0),但发现通用策略难以覆盖小说、合同等不同场景的结构差异。核心认知更新包括:需要分层抽象(规则→结构→语义→生成)、策略角色拆分、能力门控和指标闭环。最终建议转向"原型+领域特化+渐进增强"的实施路径,并提供了不同文档类型的临时分块方案。本次探索为后续特化开发奠定了基础,同时明
2025-10-20 17:12:44
1077
原创 LangChain4j 1.7.1 重磅发布:Agentic 支持类级智能体、OpenAI SDK 4.0、GPU 加速全解析!
LangChain4j 1.7.1正式版发布,带来6大核心升级:1)支持类级@Agent注解,简化智能体开发;2)升级OpenAI SDK至4.0.0;3)Azure OpenAI新增maxCompletionTokens参数控制成本;4)统一HuggingFace接口;5)通过GPULlama3实现纯Java的GPU加速;6)支持ChromaDB V2提升向量检索性能。新增4款集成工具,包括Docker支持、Oracle文档加载等。建议生产环境用户升级,但需注意Spring Boot兼容性和Hugging
2025-10-17 09:31:26
941
原创 向量数据库的“芯”法:从欧氏距离到HNSW的相似性进化论
本文探讨了向量检索中距离度量的核心作用与优化方法。文章指出,在embedding时代,向量价值取决于相似度而非精确匹配,距离度量成为关键标尺。分析了欧氏距离、余弦相似度和点积的特性及适用场景,指出高维向量带来的维度灾难问题。重点介绍了近似最近邻检索的三大技术:LSH哈希、PQ/OPQ量化和HNSW图算法,其中HNSW因工程友好性成为主流方案。此外还探讨了SIMD硬件优化等性能提升技巧,并针对不同场景提供了度量选择建议。最后强调,技术优化的终极目标是让距离度量真正符合人类语义直觉。
2025-10-11 13:50:53
829
原创 权限治理篇:Vue3 + Spring Security + JWT 认证 + 动态菜单路由 + RBAC + 审计日志全链路设计与实战
权限治理篇:Vue3 + Spring Security + JWT 认证 + 动态菜单路由 + RBAC + 审计日志全链路设计与实战
2025-10-10 16:30:19
1164
原创 开篇篇:从0到1搭建企业级 LangChain4j + Spring AI 智能对话与知识库框架(架构与模块总览)
本文介绍了一个企业级AI应用全栈实战项目,重点构建可扩展的智能体底座。项目包含多模型统一、对话系统、知识库检索和MCP工具化等核心模块,满足企业级需求如多模型并存、对话体验优化、知识增强和工具协作。架构采用后端多模块聚合(Maven)+前端多UI设计,主要模块包括多轮对话、模型统一封装、知识库索引管理等。文章还展示了会话自动摘要机制、知识库同步流程和前端交互设计,并介绍了MCP协议在工具集成中的作用。最后提供了快速部署指南,包括中间件准备和启动步骤。该项目旨在为企业提供智能对话与检索增强的最小可行底座,帮助
2025-09-30 16:30:20
685
原创 LangChain4j 1.6.0 滚烫发布:Agentic 异步收口、HumanInTheLoop 开箱即用、MCP 结构化结果、Azure Container Apps 动态会话一键集成!
LangChain4j 1.6.0 滚烫发布:Agentic 异步收口、HumanInTheLoop 开箱即用、MCP 结构化结果、Azure Container Apps 动态会话一键集成!
2025-09-28 11:31:27
603
原创 LangChain4j 1.5.0 正式来袭:异步 Agent、Gemini 出图、Bedrock Prompt 缓存、MCP 注册中心一次给齐!
LangChain4j 1.5.0 正式来袭:异步 Agent、Gemini 出图、Bedrock Prompt 缓存、MCP 注册中心一次给齐!
2025-09-28 11:27:44
604
原创 LangChain4j 1.4.0 正式版发布:Agentic 增强、MCP 流式升级、多模态与工具并发执行全面上线!
LangChain4j 1.4.0 and 1.4.0-beta10 发布
2025-09-28 11:22:00
831
原创 内存溢出(Memory Overflow)和内存泄露(Memory Leak)的区别
内存泄漏指你用malloc或new申请了一块内存,但是没有通过free或delete将内存释放,导致这块内存一直处于占用状态。内存泄漏可以分为4类:1)常发性内存泄漏。发生内存泄漏的代码会被多次执行到,每次被执行的时候都会导致一块内存泄漏。2)偶发性内存泄漏。发生内存泄漏的代码只有在某些特定环境或操作过程下才会发生。常发性和偶发性是相对的。对于特定的环境,偶发性的也许就变成了常发性的。所以...
2025-09-28 09:37:23
522
原创 【首发】LangChain4j 1.3.0 & 1.3.0-beta9 发布:Agent 能力再进化,MCP 生态全面增强
【首发】LangChain4j 1.3.0 & 1.3.0-beta9 发布:Agent 能力再进化,MCP 生态全面增强!
2025-09-28 08:58:51
178
原创 SUSE Linux Enterprise Server 设置任意端口 IP 白名单访问控制(含重启持久化)
SUSE Linux Enterprise Server 设置任意端口 IP 白名单访问控制(含重启持久化)
2025-09-12 10:16:22
455
原创 【实战踩坑】Elasticsearch 8.x 删除 RestHighLevelClient,7.17 成绝响:迁移到 Java API Client 全过程记录
【实战踩坑】Elasticsearch 8.x 删除 RestHighLevelClient,7.17 成绝响:迁移到 Java API Client 全过程记录
2025-08-15 11:02:02
693
原创 从 0 到 1 实战 LangChain4j RAG:让大模型秒懂你的私域知识
从 0 到 1 实战 LangChain4j RAG:让大模型秒懂你的私域知识
2025-08-14 09:25:34
596
原创 打通大模型与外部世界的桥梁:LangChain4j 实战 Model Context Protocol(MCP)
打通大模型与外部世界的桥梁:LangChain4j 实战 Model Context Protocol(MCP)
2025-08-14 09:06:45
722
原创 Model Context Protocol(MCP)超全解析:从原理到实战,一篇就够!
Model Context Protocol(MCP)超全解析:从原理到实战,一篇就够!
2025-08-12 16:42:34
695
原创 2025 年最值得关注的 AI 协议:Model Context Protocol(MCP)实战指南
2025 年最值得关注的 AI 协议:Model Context Protocol(MCP)实战指南
2025-08-12 16:10:46
520
原创 告别 pip!用 Rust 写的 uv 把 Python 包管理卷到 100 倍速
An extremely fast Python package and project manager, written in Rust.
2025-08-11 10:57:07
285
原创 安装 Trae 并完成初始设置(国际版)
Trae(/treɪ/)IDE 与 AI 深度集成,提供智能问答、代码自动补全以及基于 Agent 的 AI 自动编程能力。使用 Trae 开发项目时,你可以与 AI 灵活协作,提升开发效率。
2025-08-11 09:28:31
1845
原创 A2A协议最新 Roadmap 深度解读:从 0.3 稳定版到 Linux Foundation 治理新篇章
A2A协议最新 Roadmap 深度解读:从 0.3 稳定版到 Linux Foundation 治理新篇章
2025-08-08 17:32:41
928
原创 A2A Extensions 深度解析:如何优雅地扩展 Agent 通讯协议
A2A Protocol、Extensions、分布式 Agent、协议设计、微服务
2025-08-08 17:14:46
1018
原创 从“断流”到“长流”:A2A 协议如何用 SSE 与推送让 AI 任务永不下线
从“断流”到“长流”:A2A 协议如何用 SSE 与推送让 AI 任务永不下线
2025-08-08 16:49:30
451
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅