- 博客(992)
- 资源 (16)
- 收藏
- 关注
原创 Spring AI-97.升级说明
Spring AI 版本升级指南摘要: 本文详细介绍了从1.x到2.2版本的升级要点。1.x到2.0涉及模块化重构、API统一和配置变更,需调整依赖和代码。2.0到2.1新增云原生支持、优化可观测性和智能体架构。2.2版本则扩展了向量存储支持、引入流式API并优化性能。升级建议包括:检查依赖冲突、更新测试策略、参考官方文档和社区支持。各版本需适配对应的Spring Boot和Java版本,向量存储支持也随版本迭代不断扩展。
2025-06-18 08:53:27
2
原创 Spring AI-96.云绑定指南 (Cloud Bindings)
本文介绍了Spring AI的云绑定(Cloud Bindings)功能,它实现了AI组件与云平台的无缝集成。核心特性包括自动配置、多云平台支持(AWS、Azure、Google Cloud等)以及向量存储、模型服务等组件的参数绑定。文章详细说明了AWS、Azure和Google Cloud的集成示例,涵盖配置方式(环境变量/K8s Secret)和代码实现。此外,还介绍了自定义绑定、安全实践(密钥管理、成本控制)和故障转移策略。最后列举了支持的云平台列表,指出该机制简化了多云部署,未来将扩展更多云原生服务
2025-06-18 08:53:12
原创 Spring AI-95.高效智能体开发指南(Building Effective Agents)
Spring AI-95高效智能体开发指南摘要 本文介绍了基于Spring AI框架构建高效智能体的关键方法和实践。智能体通过整合工具调用、决策引擎和对话管理三大核心组件,实现复杂任务的自动化处理。主要内容包括: 核心组件:工具调用器支持外部API访问,决策引擎负责任务流程控制,对话管理器维护上下文。 开发模式: 工具优先型:适用于频繁调用外部服务的场景 向量存储增强型:适合知识库问答系统 多工具协同型:处理需要组合多个工具的复杂任务 优化策略:参数验证、错误处理、批量调用、缓存机制和异步处理等提升性能的方
2025-06-18 08:53:01
原创 Spring AI-94.提示工程模式指南 (Prompt Engineering Patterns)
Spring AI提示工程模式指南摘要 Spring AI提供多种提示工程模式,帮助开发者优化AI模型响应质量。核心模式包括: 零样本提示 - 直接指令式查询,适用于简单问答 少样本提示 - 提供示例引导格式,适合严格结构化输出 思维链提示 - 分步推理解决复杂问题 上下文管理 - 采用滑动窗口或摘要处理长文本限制 提示模板 - 参数化复用常见场景提示结构 输出控制 - 通过显式指令确保格式一致性 多模态提示 - 结合文本与图像输入 最佳实践包括迭代优化提示、敏感内容控制和本地化适配。这些模式能显著提升生成
2025-06-18 08:52:47
原创 Spring AI-93.集成 Testcontainers 指南
Spring AI集成Testcontainers指南:通过spring-ai-testcontainers模块快速启动向量存储容器(Qdrant/Chroma/Weaviate/Milvus)进行自动化测试。提供依赖配置、容器实例化示例及测试用例代码,支持自定义参数、容器共享和Spring自动装配。该方案简化了向量存储集成验证流程,适用于单元测试和CI/CD环境,确保功能可靠性的同时降低配置成本。注意容器启动顺序、资源清理和版本兼容性等问题。
2025-06-18 08:52:37
原创 Spring AI-92.集成 Docker Compose 指南
Spring AI 通过 Docker Compose 简化向量存储服务集成,支持自动连接 Chroma、Qdrant、OpenSearch 和 Weaviate 等服务。开发者只需添加依赖并运行匹配的容器,Spring AI 即自动配置连接,也可手动覆盖参数。该功能显著简化了本地开发环境搭建,支持快速原型验证和微服务部署,让开发者更专注于业务逻辑而非基础设施配置。
2025-06-18 08:52:27
原创 Spring AI-91.可观测性指南(Observability)
Spring AI 深度整合 Spring 生态的可观测性能力,为聊天模型、嵌入模型、向量存储等核心组件提供全面的监控支持。系统自动记录调用耗时、token用量等关键指标,并通过低基数/高基数标签区分维度。开发者可精细控制敏感数据(如提示内容、响应结果)的导出,通过属性配置实现安全监控。该机制支持与OpenTelemetry等主流追踪系统对接,帮助优化AI应用性能与稳定性,同时规避数据泄露风险。
2025-06-18 08:52:18
原创 Spring AI-90.集成 Weaviate 向量存储指南
Spring AI 集成 Weaviate 向量存储指南: Weaviate 是一款开源向量数据库,支持存储数据对象、向量嵌入及元数据过滤。Spring AI 通过 WeaviateVectorStore 实现无缝集成,适用于构建语义检索系统。 核心功能: 支持 Docker 本地部署或云端服务 提供自动配置依赖(starter)和手动配置选项 可自定义文档类名、一致性级别等参数 支持文档增删改查及相似性搜索 内置元数据过滤功能(支持字符串表达式和 DSL 构建器) 典型应用场景包括:语义搜索、推荐系统、知
2025-06-18 08:52:03
1
原创 Spring AI-89.集成 Weaviate 向量存储指南
Spring AI 与 Weaviate 的集成提供了可扩展的向量存储解决方案,适合构建大规模语义搜索和推荐系统。通过自动配置和 Weaviate 的分布式架构,开发者可轻松实现高吞吐、低延迟的向量检索,结合元数据过滤和原生 GraphQL 查询,满足复杂业务场景需求。Weaviate 是开源向量数据库,支持存储数据对象、向量嵌入及元数据过滤,Spring AI 通过。实现集成,适用于构建可扩展的语义检索系统。确保服务运行并监听端口 8080。
2025-06-18 08:51:53
原创 Spring AI-88.集成 Typesense 向量存储指南
Spring AI集成Typesense向量存储指南:开源低延迟搜索引擎与Spring AI的无缝对接。通过TypesenseVectorStore实现高效向量存储和检索,支持Docker本地部署(默认端口8108)或云端服务。核心配置包括集合名称、向量维度(默认1536)、服务地址和API密钥。提供自动/手动两种Bean配置方式,支持文档添加、相似性搜索(可设置topK和阈值)及元数据过滤查询(字符串表达式或DSL构建器)。还能通过原生客户端执行高级操作,如创建集合和管理索引。典型应用场景包括知识库构建和
2025-06-18 08:51:43
原创 Spring AI-87.集成 SAP HANA Cloud 向量存储指南
Spring AI集成SAP HANA Cloud向量存储指南: 环境准备 需SAP HANA Cloud试用账户,启用向量引擎 添加spring-ai-starter-vector-store-hana和嵌入模型依赖 核心配置 设置数据库连接URL、用户名、密码 指定向量存储表名,可选自动初始化表结构 使用流程 文档自动切分并存储为向量 支持相似性搜索(如topK=3) 可结合LLM实现RAG应用 注意事项 需确保向量维度与模型匹配 大规模数据需优化分区和索引 该方案适用于需要SAP生态整合的企业级RAG
2025-06-18 08:51:30
3
原创 Spring AI-86.集成 Redis 向量存储指南
Spring AI 整合 Redis 向量存储,支持高效向量检索和元数据过滤。需部署 Redis Stack 并配置 HNSW 索引,通过 RedisVectorStore 实现文档存储与相似性搜索。核心功能包括:自动/手动配置索引、批量插入策略优化(TOKEN_COUNT/FIXED_SIZE)、基于表达式或 DSL 的元数据过滤。使用时需注意维度匹配(如 OpenAI 嵌入需 1536 维)和内存管理。典型场景包括文档检索、知识库问答等,通过 Redis 高性能实现低延迟向量查询。
2025-06-18 08:51:18
原创 Spring AI-85.集成 Qdrant 向量存储指南
摘要: Spring AI通过QdrantVectorStore集成开源向量数据库Qdrant,支持高效相似性检索与元数据过滤。核心步骤包括:1)部署Qdrant并配置连接参数(主机、端口、集合名);2)通过自动或手动方式初始化向量存储;3)执行文档添加、相似性搜索(支持阈值过滤)及复杂元数据查询(表达式/DSL构建器)。Qdrant的HNSW算法、分片机制和多种相似度度量(如余弦)可优化性能,需注意集合维度匹配与安全认证。该方案适用于RAG系统、语义搜索等场景,结合Spring AI简化了高性能向量检索的
2025-06-18 08:51:07
原创 Spring AI-84.集成 Pinecone 向量存储指南
Spring AI与Pinecone集成指南摘要 Spring AI通过PineconeVectorStore集成高性能云向量数据库Pinecone,支持文档存储与相似性搜索。关键步骤包括: 1️⃣ 环境准备 注册Pinecone并创建索引,获取API Key 添加spring-ai-starter-vector-store-pinecone和嵌入模型依赖 2️⃣ 核心配置 必填API Key和索引名称 可选命名空间(免费版不支持)和超时设置 3️⃣ 操作示例 自动/手动配置VectorStore Bean
2025-06-18 08:50:57
原创 Spring AI-83.集成 PGvector 向量存储指南
Spring AI 集成 PGvector 向量存储指南摘要 PGvector 作为 PostgreSQL 的向量扩展,可通过 Spring AI 的 PgVectorStore 实现高效向量存储与检索。核心步骤包括: 环境准备:需 PostgreSQL 安装 vector 扩展,并创建包含 embedding 字段的表结构 配置集成:通过 spring-ai-starter-vector-store-pgvector 依赖和 YAML 参数(如索引类型、距离度量)快速接入 功能实现:支持文档批量写入、相似
2025-06-18 08:50:45
2
原创 Spring AI-82.集成 Oracle Database 23ai 向量搜索指南
Spring AI 集成 Oracle 23ai 向量搜索指南摘要 本文介绍了 Spring AI 与 Oracle Database 23ai 向量搜索功能的集成方案。通过 OracleVectorStore 实现文档嵌入存储和相似性检索,详细说明了环境配置、核心属性设置(如索引类型、相似度度量)、自动/手动 Bean 配置方法,以及数据操作(文档添加、相似性搜索)、元数据过滤等关键功能。同时提供了索引选择(IVF/HNSW)和性能优化建议,如向量归一化、精度控制等。开发者可通过简单配置快速实现高效向量搜
2025-06-17 08:53:06
3
原创 Spring AI-81.集成 OpenSearch 向量存储指南
Spring AI 集成 OpenSearch 指南摘要: OpenSearch 作为开源的搜索分析引擎,通过 OpenSearchVectorStore 实现向量存储与相似性搜索功能。配置需指定集群 URI、索引名和相似性函数(如 cosinesimil),支持自动初始化索引。核心功能包括文档添加、相似性搜索(可设置 topK 和阈值)以及基于元数据的过滤查询(支持表达式或 DSL 构建)。性能优化可通过手动创建索引(定义 dense_vector 字段)实现。适用于构建低延迟 AI 应用,需注意 AWS
2025-06-17 08:52:50
5
原创 Spring AI-80.集成 Neo4j 向量存储指南
Spring AI 集成 Neo4j 向量存储指南摘要 Neo4j 作为开源图数据库,通过 Spring AI 的 Neo4jVectorStore 支持向量搜索功能。关键要点: 环境配置 要求 Neo4j 5.15+,支持向量索引 添加 spring-ai-starter-vector-store-neo4j 依赖 核心功能 自动/手动配置向量索引和节点标签 支持相似性搜索(余弦或欧式距离) 元数据过滤查询(字符串表达式或DSL构建器) 性能优化 使用 HNSW 算法创建向量索引 结合图结构特性提升检索效
2025-06-17 08:52:39
1
原创 Spring AI-79.集成 MongoDB Atlas 向量存储指南
Spring AI 集成 MongoDB Atlas 向量存储指南摘要: MongoDB Atlas 提供全托管向量搜索功能,Spring AI通过MongoDBAtlasVectorStore实现文档嵌入存储与相似性检索。核心配置包括:1) 环境准备:需MongoDB 6.0.11+集群并配置向量索引;2) 通过starter依赖快速集成;3) 支持自动/手动配置集合与索引参数。主要功能涵盖:文档添加、相似性搜索(支持topK和阈值过滤)、元数据条件查询(转换为MongoDB聚合操作)。性能优化建议使用H
2025-06-17 08:52:28
1
原创 Spring AI-78.集成 Milvus 向量存储指南
Spring AI 集成 Milvus 向量数据库指南摘要: Milvus 是高性能开源向量数据库,Spring AI 通过 MilvusVectorStore 提供支持。核心步骤包括: 环境准备 - 部署 Milvus 服务(单机/集群),添加 Spring AI Milvus 依赖; 配置管理 - 设置主机地址、端口、集合名称等参数,支持自动创建集合; 操作示例 - 提供文档添加、相似性搜索(支持元数据过滤和原生表达式)的代码实现; 性能优化 - 推荐调整索引类型(IVF_FLAT/HNSW)和检索参数
2025-06-17 08:52:15
1
原创 Spring AI-77.集成 MariaDB 向量存储指南
Spring AI 集成 MariaDB 指南:通过 MariaDBVectorStore 支持向量存储与相似性搜索。需 MariaDB 11.7+,配置包含向量维度、距离类型(COSINE/EUCLIDEAN)和表初始化。支持文档添加、相似性搜索(可设阈值)和元数据过滤(自动转为 JSON 路径表达式)。注意表结构需含向量字段索引,根据向量是否归一化选择合适距离函数。适用于快速实现 AI 应用的语义搜索功能。
2025-06-17 08:52:04
109
原创 Spring AI-76.集成 GemFire 向量存储指南
摘要: Spring AI 通过 GemFireVectorStore 集成 GemFire 向量数据库,提供高性能的向量存储与检索功能。配置需明确主机地址、端口、索引名称及相似性函数(支持 COSINE/L2_NORM/DOT_PRODUCT)。支持自动创建索引(initializeSchema=true)或手动配置,核心操作包括文档添加与相似性搜索(暂不支持元数据过滤)。GemFire 的内存架构优化了低延迟场景,适用于实时推荐等高频查询需求。开发者可通过简单 API 快速构建基于 GemFire 的
2025-06-17 08:51:50
1
原创 Spring AI-75.集成 Elasticsearch 向量存储指南
Spring AI 集成 Elasticsearch 向量存储指南摘要 Spring AI 通过 ElasticsearchVectorStore 实现与 Elasticsearch 的高效集成,支持文档嵌入存储与语义搜索。核心要点: 环境配置 需 Elasticsearch ≥8.13.3,通过 spring.elasticsearch.* 配置连接; 向量索引维度需与嵌入模型匹配,支持 cosine/l2_norm 相似性算法。 功能实现 自动/手动配置索引,支持文档增删改查; 相似性搜索支持元数据过滤
2025-06-17 08:51:35
1
原创 Spring AI-74.集成 Couchbase 向量存储指南
摘要: Spring AI与Couchbase集成指南,通过CouchbaseSearchVectorStore实现分布式向量存储与搜索。支持文档嵌入存储、相似性检索及元数据过滤,需Couchbase 7.6+和Java SDK 3.6.0+。配置涵盖连接参数、向量维度及相似性函数(dot_product/l2_norm),提供自动/手动初始化选项。核心功能包括文档添加、相似性搜索(支持topK和阈值过滤)以及表达式/DSL元数据过滤,适用于AI增强的检索场景。(150字)
2025-06-17 08:51:23
1
原创 Spring AI-73.集成 Chroma 向量存储指南
Spring AI 集成 Chroma 向量存储指南:通过 ChromaVectorStore 提供对开源向量数据库 Chroma 的支持。需先启动本地 Chroma 服务(Docker 运行),添加相关依赖后配置连接属性和集合名称。支持自动/手动两种配置方式,提供文档存储、相似性搜索和元数据过滤功能,表达式会自动转换为 Chroma JSON 格式。注意生产环境需手动管理集合初始化,并确保正确配置嵌入模型(如 OpenAI)。该集成简化了 AI 应用中向量数据的存储与检索流程。
2025-06-17 08:51:08
1
原创 Spring AI-72.集成 Apache Cassandra 向量存储指南
Spring AI 通过 CassandraVectorStore 集成 Apache Cassandra 数据库,实现高效的向量存储与相似性检索。主要特性包括: 基于 Cassandra 的分布式架构和 JVector 库,支持 HNSW 算法的高性能向量搜索 提供自动建表、元数据索引、线程池调优等配置选项 支持带过滤条件的相似性查询,可通过表达式或 DSL 构建复杂查询逻辑 适用于 RAG 等 AI 应用场景,可处理维基百科等大规模数据集 配置简单,仅需定义键空间、表结构和 Embedding 模型即可
2025-06-17 08:50:57
124
原创 Spring AI-71.集成 Azure Cosmos DB 向量存储指南
Spring AI 集成 Azure Cosmos DB 向量存储指南摘要 Spring AI通过CosmosDBVectorStore集成Azure Cosmos DB,利用其分布式架构和DiskANN技术实现高效向量存储与检索。关键点包括: 技术基础 Azure Cosmos DB提供全球分布式存储,支持大规模AI应用 DiskANN技术优化高维向量检索性能,处理超内存数据集 配置与使用 添加starter依赖,配置端点、数据库、容器等关键属性 支持自动配置或手动构建VectorStore,可设置分区键
2025-06-17 08:50:39
1
原创 Spring AI-70.集成 Azure AI 搜索向量存储指南
可快速将 Azure AI 搜索集成到 RAG 系统中,实现基于向量的高效检索。结合元数据过滤和原生客户端扩展,满足复杂业务场景需求,适用于企业级云原生 AI 应用。集成 Azure AI 搜索服务,实现文档向量化存储与相似性检索。:Spring AI 将通用过滤表达式自动转换为 Azure 搜索的 OData 格式(如。Spring AI 支持通过。通过 Spring AI 的。
2025-06-17 08:50:28
1
原创 Spring AI-69.向量数据库集成指南
Spring AI向量数据库集成指南 摘要:Spring AI提供统一的VectorStore接口,支持多种主流向量数据库(如Pinecone、Milvus等),用于实现RAG场景的数据存储与检索。核心功能包括:文档向量化存储、相似性搜索(支持元数据过滤和阈值控制)、批量处理策略(解决token限制问题)。开发者可选择适合的数据库实现(从轻量级Chroma到生产级Milvus),通过统一API完成数据写入、检索和删除操作。该模块特别优化了RAG流程,支持上下文检索与提示词构建,并可通过批量策略和元数据过滤提
2025-06-17 08:50:16
1
原创 Spring AI-68.评估测试模块总结(Evaluation Testing)
Spring AI评估测试模块提供了验证AI模型响应质量的核心工具,主要功能包括相关性评估和事实核查。通过Evaluator接口和预置的RelevancyEvaluator、FactCheckingEvaluator实现,开发者可以验证响应是否与上下文相关且事实准确。该模块支持自定义提示模板和多种AI模型(如轻量级的Minicheck),适用于RAG流程验证、内容合规检查等场景。评估结果可用于自动化测试和质量保障,确保AI生成内容的可靠性和相关性。
2025-06-17 08:50:04
2
原创 Spring AI-67.ETL 管道
本文介绍了Spring AI框架中的ETL(提取、转换、加载)管道系统,该系统是检索增强生成(RAG)应用的核心数据处理组件。文章详细解析了ETL管道的三层架构:DocumentReader负责从各类文件(JSON、文本、HTML、PDF等)读取数据;DocumentTransformer提供文本拆分、格式转换和元数据增强等功能;DocumentWriter完成数据存储。重点展示了TokenTextSplitter、KeywordMetadataEnricher等核心转换器的具体实现方式,以及如何通过简单的
2025-06-16 15:08:32
9
原创 Spring AI-66.检索增强生成(RAG)模块参考文档总结
Spring AI 的检索增强生成(RAG)模块通过结合向量存储与语言模型,解决大模型在长文本处理和事实准确性上的局限。该架构包含检索、生成两阶段,支持预处理(查询转换/扩展)、检索(向量匹配)、后处理(排序/压缩)和生成(上下文增强)的自定义组件。内置两种顾问:QuestionAnswerAdvisor提供基础检索问答,RetrievalAugmentationAdvisor支持完整RAG流程定制。开发者可通过参数调优(相似度阈值、结果数量)和多语言处理(查询翻译)优化效果。模块化设计便于扩展各阶段组件,
2025-06-16 15:08:20
8
原创 Spring AI-65.MCP 工具类参考文档总结
Spring AI 的 MCP 工具类提供了 Model Context Protocol 与 Spring AI 工具系统的集成支持,主要包含工具回调适配器、提供器以及规格转换等功能。它支持同步/异步操作,可通过适配器将 MCP 工具转换为 Spring AI 的 ToolCallback 接口,并提供批量工具管理能力。此外,还包含原生镜像支持,通过 McpHints 类解决 GraalVM 原生镜像下的反射问题。该工具类简化了 MCP 与 Spring AI 的集成流程,支持跨框架交互和多种应用场景,是
2025-06-16 15:08:05
5
原创 Spring AI-64.MCP 服务器启动器文档总结
摘要(140字) Spring AI 的 MCP 服务器启动器提供三种协议实现:标准(STDIO)、WebMVC(SSE)、WebFlux(响应式SSE),支持工具、资源和提示词模板的动态管理。核心配置包括传输协议开关、事件通知和工具响应类型。通过@Tool注解或Java配置快速注册工具,并实时推送变更事件。适用于轻量级CLI或高并发Web场景,简化AI模型与工具的中间层开发。(示例代码展示WebFlux配置与客户端调用)
2025-06-16 15:07:55
85
原创 Spring AI-63.MCP 客户端启动器文档总结
Spring AI 的 MCP 客户端启动器提供了在Spring Boot应用中集成Model Context Protocol客户端的自动配置支持,包含两种启动器类型(标准客户端和WebFlux客户端)。它支持同步/异步通信以及STDIO/SSE传输协议,具有客户端定制、工具回调集成、文件系统访问控制等功能。配置简洁,通过yaml文件即可完成基本设置,同时提供丰富的定制化选项。该组件简化了AI模型集成流程,适用于智能客服、内容生成等多种AI应用场景,兼顾开发便捷性与系统安全性。
2025-06-16 15:07:46
原创 Spring AI-62.MCP(模型控制平面)概述
Spring AI的模型控制平面(MCP)是企业级AI应用的核心管理模块,提供统一模型管理、动态配置路由、安全合规和监控治理功能。MCP架构包含模型仓库、配置中心、客户端SDK和适配层,支持本地与第三方模型的注册发现、权限控制、流量分流和性能监控,可实现多模型切换、版本管理及安全合规等场景。通过Spring集成和扩展机制,MCP简化了AI模型全生命周期管理,为构建可靠、可扩展的AI系统提供核心支撑。
2025-06-16 15:07:36
1
原创 Spring AI-61. 工具(Tools)API 参考文档
摘要: Spring AI 的工具(Tools)模块提供了集成外部服务的标准化接口,支持AI应用调用计算器、数据库、API等工具。核心包含Tool接口(定义工具名称、描述和执行逻辑)和ToolExecutor接口(管理工具注册与调用)。系统提供计算器、HTTP请求、JDBC查询等内置工具,并支持自定义工具开发(如天气查询)。工具可通过Spring配置注册,结合LLM实现智能对话中的动态调用。参数校验机制确保调用安全性,完整协议支持从用户请求到工具执行的全流程管理。(149字)
2025-06-16 15:07:21
原创 Spring AI-60. 聊天记忆(Chat Memory)API 参考文档
Spring AI 的聊天记忆(Chat Memory)模块为多轮对话场景提供上下文管理能力,支持基于内存、会话、Redis 和 MongoDB 的不同实现。核心接口 ChatMemory 包含消息存储、获取和清空功能,可无缝集成到聊天流程中。该模块还提供消息截断、系统提示等高级功能,适用于智能客服、对话机器人等应用场景。通过结合 LLM 调用,开发者能轻松实现具有上下文感知能力的对话系统。
2025-06-16 15:07:10
1
原创 Spring AI-59.Mistral AI 内容审核 API 参考文档
本文介绍如何在Spring AI中集成Mistral AI的内容审核服务。主要内容包括:1) 环境准备步骤,包括API密钥获取和依赖配置;2) 核心配置说明,涵盖端点、密钥、模型选择等参数;3) API接口详细说明,包括请求参数和审核结果结构;4) 使用示例代码,演示单条审核、批量处理和自定义配置;5) 注意事项,涉及模型选择、输入限制、性能优化和错误处理。该集成方案适用于检测文本中的敏感内容,具有低延迟、高吞吐量的特点,可满足社交媒体、即时通讯等场景的内容安全需求。
2025-06-16 15:07:01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人