
310-AI
文章平均质量分 90
oscar999
毕业于中国科学技术大学,数据库四级、通过系统设计师、系统分析师、信息系统项目管理师资格认证。国际项目管理(IPMP)C级认证。超过20年软件项目开发和管理经验,精通Java Web相关技术(包括Spring系列、Ext JS等),熟悉PHP、Python、C#、Vue及AI等开发技术。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
AI增强的软件测试工具
AI增强的软件测试工具通过人工智能技术实现全流程自动化,覆盖测试设计、脚本生成、执行优化、缺陷预测等全生命周期。核心能力包括智能生成测试用例、自适应脚本构建、测试套件优先级排序、深度结果分析和缺陷预警。这些工具显著提升测试覆盖率与效率,实现人机协同,减少人工干预。头部工具如Tricentis Testim(AI驱动的端到端测试)和BrowserStack(全生命周期AI代理)通过智能元素定位、自愈测试等功能,帮助团队适应快速迭代,提升50%以上测试效率。这类工具正成为现代软件工程中质量保障的关键赋能者。原创 2025-08-06 23:10:10 · 1208 阅读 · 0 评论 -
在线免费的AI文本转语音工具TTSMaker介绍
TTSMaker是一款专业在线文本转语音工具,支持50+种语言及300+种语音风格,包括中文方言和多种发音特色。其核心优势在于提供商用级音频输出(MP3/WAV等格式)、每周3万字符免费额度及100%版权归属。用户可精细调节语速、音调并插入停顿,生成接近真人发音的音频。操作简单:输入文本→选择语音→转换下载,适用于教育、内容创作、企业商用等场景。基于神经网络技术,转换速度快且支持API批量处理。免费政策允许商业用途,是高效便捷的语音合成解决方案。官网:ttsmaker.cn原创 2025-08-01 23:10:30 · 1876 阅读 · 0 评论 -
Spring AI 之工具调用
摘要 工具调用是AI应用中增强模型能力的重要方式,分为信息检索和执行操作两大类。信息检索工具扩展模型知识库(如获取实时天气),执行工具自动化任务(如发送邮件)。Spring AI提供了便捷的API实现工具调用,安全机制确保模型只能请求调用而不能直接访问API。示例展示了通过@Tool注解定义日期查询和闹钟设置工具,模型可组合调用这些工具完成复杂任务(如10分钟后设置闹钟需先获取当前时间)。该机制有效弥补了AI模型无法获取实时信息和执行物理操作的局限。原创 2025-06-04 23:25:16 · 1221 阅读 · 0 评论 -
Spring AI 之检索增强生成(Retrieval Augmented Generation)
摘要: Spring AI通过增强器(Advisors)提供检索增强生成(RAG)支持,帮助语言模型结合外部数据提升回答准确性。QuestionAnswerAdvisor核心功能包括:从向量数据库检索相关文档,动态过滤(支持SQL表达式),以及自定义提示模板整合上下文。开发者可通过配置相似度阈值、结果数量及运行时过滤条件优化搜索,并灵活定制提示模板的占位符(query和question_answer_context)以适应不同场景。依赖spring-ai-advisors-vector-store即可快速集原创 2025-06-02 22:02:35 · 950 阅读 · 0 评论 -
Spring AI 之对话记忆(Chat Memory)
摘要:Spring AI为解决大型语言模型(LLMs)无状态限制,提供对话记忆功能(ChatMemory),支持在多次交互中存储上下文信息。该系统区分对话记忆(用于维持上下文)和对话历史记录(完整对话存档),并提供多种记忆类型(如基于消息窗口的MessageWindowChatMemory)和存储方案(包括内存存储InMemoryChatMemoryRepository和JDBC持久化存储JdbcChatMemoryRepository)。JDBC实现支持PostgreSQL等主流数据库,可通过方言扩展适配原创 2025-05-29 23:46:43 · 1284 阅读 · 0 评论 -
Spring AI 整合聊天模型之智谱AI
本文介绍了如何在Spring AI项目中集成智谱AI(ZhiPu AI)的语言模型服务,实现多语言会话助手功能。主要内容包括: 注册智谱AI平台并获取API Key; 配置Spring AI项目,通过application.properties或环境变量安全设置API Key; 添加Maven依赖启用自动配置; 详细说明了聊天属性配置,包括重试机制、连接参数和模型选项; 介绍了可配置的模型参数,如温度、top_p、最大token数等。 文章提供了完整的配置指南,帮助开发者快速集成智谱AI的GLM系列模型(如原创 2025-05-28 22:19:44 · 976 阅读 · 1 评论 -
Spring AI之快速免费使用智谱AI全过程
本文介绍了如何通过Spring AI快速集成智谱AI(ZhiPuAI)的聊天模型。首先需注册智谱AI账号获取API Token,然后创建Spring Boot项目并配置相关依赖,包括spring-ai-starter-model-zhipuai等。示例代码展示了如何通过控制器实现AI生成笑话的功能,支持普通和流式两种返回方式。最后,运行项目并测试接口效果,验证了智谱AI的集成可行性。文章还提醒注意依赖配置,避免启动错误。原创 2025-05-27 23:22:36 · 776 阅读 · 0 评论 -
Spring AI 之多模态
多模态大语言模型正成为AI领域新趋势。与传统单模态模型不同,新一代模型如GPT-4o、Claude3等能并行处理文本、图像、音频和视频输入。Spring AI通过消息API实现多模态支持,允许在用户消息中嵌入多种媒体资源,并提供对主流多模态模型的支持。开发者可通过简洁API实现跨模态交互,如让模型分析图片内容并生成文本描述。这种融合处理能力使AI更接近人类的多感官认知方式,为应用开发开辟了新可能。原创 2025-05-26 22:10:45 · 737 阅读 · 0 评论 -
Spring AI 之结构化输出转换器
Spring AI 更新了结构化输出转换器,弃用旧版Parser类,改用Converter实现类以提升功能一致性。新类如StructuredOutputConverter、BeanOutputConverter等可直接替代旧版,并支持JSON/XML等格式转换,帮助开发者将LLM文本输出快速转换为Java对象。转换过程包含提示词格式化指令和输出解析两步,但需注意模型可能无法完全遵循结构化要求。当前提供多种转换器实现,包括处理Bean、Map和List等场景的专用转换器,适用于不同下游应用的数据处理需求。原创 2025-05-24 22:16:13 · 266 阅读 · 0 评论 -
Spring AI 之提示词
提示词(Prompts)是引导AI模型生成特定输出的关键输入,其设计和措辞直接影响模型响应。在Spring AI中,提示词的处理方式类似于Spring MVC中的视图管理,涉及动态内容占位符的替换。Spring AI通过ChatModel和ChatClient等类与AI模型交互,类似于JDBC中的核心库和客户端。提示词的结构从简单字符串发展为包含特定输入占位符和角色分类的复杂形式。Prompt类用于存储有序的Message对象和请求选项,每个Message在提示词中扮演独特角色,如用户查询、AI响应或背景信原创 2025-05-22 22:29:57 · 226 阅读 · 0 评论 -
Spring AI之Advisors (增强器)
增强器应用程序编程接口(Advisors API)Spring AI Advisors API 提供了一种灵活且强大的方式,用于在 Spring 应用程序中拦截、修改和增强由人工智能驱动的交互。通过利用增强器 API,开发人员能够创建更复杂、可重用且易于维护的人工智能组件。其主要优势包括:封装重复出现的生成式人工智能模式,对发送至大型语言模型(LLMs)以及从大型语言模型接收的数据进行转换,并在不同模型和用例之间提供可移植性。建议使用构建器的方法在构建时注册增强器。原创 2025-05-22 22:22:35 · 158 阅读 · 0 评论 -
Spring Boot AI 之 Chat Client API 使用大全
ChatClient 提供了一套流畅的 API,支持与 AI 模型进行同步和流式交互。通过构建 Prompt,用户消息和系统消息被传递给 AI 模型,其中用户消息是直接输入,系统消息用于引导对话。Prompt 可包含占位符,运行时根据用户输入进行替换,定制 AI 响应。ChatClient 通过 ChatClient.Builder 创建,支持自动配置或编程方式构建。在需要与多个聊天模型协作的场景中,可以手动创建多个 ChatClient 实例,或为不同模型类型定义单独的 ChatClient bean,并原创 2025-05-21 22:33:22 · 1411 阅读 · 0 评论 -
Spring AI 介绍
Python因其简洁语法、丰富的AI库和框架、跨平台兼容性及活跃社区,成为AI开发的主要语言。Spring AI框架的推出为Java开发者提供了快速进入AI开发的机会。Spring AI旨在将Spring生态系统的设计原则应用于AI领域,支持主流AI模型和向量数据库,提供可移植API、结构化输出、工具调用、可观测性等功能。通过Spring Boot自动配置,开发者可以轻松集成AI模型和向量存储。快速开始指南展示了如何使用Spring AI与Azure OpenAI进行简单对话,并提供了完整项目示例代码。Sp原创 2025-05-20 23:25:33 · 638 阅读 · 0 评论 -
Spring AI 之 AI核心概念
AI核心概念介绍原创 2025-05-07 23:02:51 · 2646 阅读 · 0 评论 -
Spring Boot之MCP Client开发全介绍
标准启动器(spring-ai-starter-mcp-client)允许客户端同时通过 STDIO(进程内)和/或 SSE(远程)传输方式连接到单个或多个 MCP 服务器。WebFlux 启动器提供了与标准启动器类似的功能,但它使用的是基于 WebFlux 的 SSE(服务器发送事件,Server-Sent Events)传输实现。通过引入此依赖,可以利用 WebFlux 的响应式编程模型来处理与 MCP 服务器的 SSE 连接,从而在需要高并发和低延迟的场景下提供更好的性能。原创 2025-05-06 22:20:25 · 1576 阅读 · 0 评论 -
Spring Boot 之MCP Server开发全介绍
完整支持 MCP 服务器的所有功能,基于 Spring WebFlux 并提供基于 SSE(服务器发送事件,Server-Sent Events)的服务器传输方式,同时可选支持 STDIO 传输方式。完整支持 MCP 服务器的所有功能,基于 Spring MVC 并提供基于 SSE(服务器发送事件,Server-Sent Events)的服务器传输方式,同时可选支持 STDIO 传输方式。根据服务器类型(同步或异步),自动将提示信息规范转换为相应的同步或异步形式,简化了开发过程中的规范转换工作。原创 2025-05-05 08:05:13 · 1474 阅读 · 0 评论 -
SSE(Server-Sent Events)完整使用示例
本篇使用Node.js 作为服务端,在浏览器客户端演示SSE的完整实例和演示。实现了一个基于 Server-Sent Events (SSE) 的实时数据推送功能。原创 2025-05-04 09:55:18 · 277 阅读 · 0 评论 -
一篇撸清 Http,SSE 与 WebSocket
特性HTTPWebSocket通信模式请求-响应(客户端主动发起)单向推送(仅服务器到客户端)全双工(客户端与服务器双向通信)协议基础基于 HTTP基于 HTTP 长连接独立协议(握手阶段依赖 HTTP)连接类型短连接(默认)或长连接(HTTP/1.1)长连接(持久性)长连接(持久性)数据格式任意格式(文本、二进制等)仅文本(UTF-8)文本和二进制延迟高(依赖轮询或长轮询)低(服务器主动推送)极低(双向即时通信)自动重连不支持支持(内置重连机制)原创 2025-05-04 09:54:25 · 623 阅读 · 0 评论 -
纯Java实现STDIO通信的MCP Server与客户端验证
在 MCP 协议中通过 STDIO(标准输入/输出)通信 是一种进程间通信(IPC)方式,服务器与客户端通过标准输入(stdin)和标准输出(stdout)交换数据。Spring Boot 实现MCP Server相对来说更为简单,本篇介绍在不使用Spring Boot的状况下,如何实现实现 STDIO 的MCP服务器以及调用验证。实例说明本篇和Spring Boot篇类似,实现一个简单加法的 Tool。简单起见,仅演示MCP的Tool的功能,为了更简单,该工具实现的功能只是一个简单的加法运算。原创 2025-05-03 19:49:14 · 1173 阅读 · 0 评论 -
基于Spring Boot实现STDIO通信的MCP Server与验证
创建一个Spring Boot项目。可以通过Spring initializer 创建,也可以在目录中直接添加一个 pom.xml 文件。这里的项目名称是mcp-spring添加依赖项</</</</</</</</</</</</</</</</</</</</</</</</</</</</</</</添加一个计算器的工具类 MyCalculateService,这个类有一个方法 add()使用@Tool 注解为一个工具。/***/@Service完成主入口类文件。原创 2025-05-03 18:08:05 · 1577 阅读 · 0 评论 -
MCP Java SDK 介绍与使用指南
io.modelcontextprotocol.sdk:mcp-spring-webmvc - 用于基于 servlet 的应用的基于 WebMVC 的服务器发送事件 (SSE) 传输实现。io.modelcontextprotocol.sdk:mcp-spring-webflux - 用于响应式应用的基于 WebFlux 的服务器发送事件 (SSE) 传输实现。io.modelcontextprotocol.sdk:mcp-test - MCP 应用的测试工具和支持。原创 2025-04-29 22:59:24 · 1658 阅读 · 0 评论 -
Cline 之Plan和Act模式
Plan/Act 框架通过强制分离规划与实施阶段,有效避免了传统开发中常见的"边想边做"问题,特别适用于中大型项目的系统性开发。建议开发团队根据项目复杂度动态调整模式切换频率,在敏捷性和严谨性之间取得最佳平衡。原创 2025-04-22 23:14:11 · 1013 阅读 · 0 评论 -
AI编程助手Cline之快速介绍
中的开源 AI 编程助手插件,旨在通过结合大语言模型(如 Claude 3.5 Sonnet、DeepSeek V3、Google Gemini 等)和工具链,为开发者提供自动化任务执行、智能代码生成、错误修复等功能,显著提升开发效率。安装之后需要提供API的提供商和Token.Cline 是一款深度集成在。原创 2025-04-22 22:58:57 · 1147 阅读 · 0 评论 -
RAG的实现快速示例
其实就是结合了检索与生成,核心流程分为检索(Retrieval)和生成(Generation)两大阶段,通过外部知识库增强生成式模型的准确性和可靠性。流程其实也很简单,如下图:本篇通过一个快速示例演示RAG的实现。原创 2025-04-10 23:12:15 · 786 阅读 · 0 评论 -
基于Python+LanceDB实战向量搜索
本篇实战演示向量搜索的实现和示例。原创 2025-03-27 23:06:46 · 434 阅读 · 0 评论 -
Hugging Face镜像——再也不用烦恼无法从Hugging Face下载模型和数据集了
在AI 开发的时候很多时候会从Hugging Face下载模型和数据集,但是直接访问会提升速度慢或者无法下载,解决方法就是使用Hugging Face 的中国镜像。镜像站地址为:。这个镜像由国内开发者维护,支持模型、数据集、库文件的加速下载。datasets首先安装依赖,然后设置环境变量。原创 2025-03-26 22:40:23 · 7007 阅读 · 0 评论 -
在本地Windows机器加载大模型并生成内容
本篇演示在本地机器下载和加载大模型并获取AI产生的内容。简单起见,使用的大模型是Qwen2.5-0.5B-Instruct,整个模型的所有文件不到1G。Qwen2.5-0.5B-Instruct 是阿里巴巴云 QWen 团队基于Transformer 架构开发的轻量级指令调优语言模型,专为资源有限场景设计。环境准备。原创 2025-03-25 21:58:09 · 961 阅读 · 0 评论 -
使用LLM 构建MCP服务端和客户端
MCP Inspector 工具测试服务器。包括README 和相关文档。它需要与哪些外部系统交互。连接到其他的MCP客户端。服务器将暴露哪些资源。原创 2025-03-23 21:51:17 · 658 阅读 · 0 评论 -
一篇道尽MCP核心概念
MCP让实现自定义传输变得简单。任何传输实现只需要符合Transport接口即可:可以实现自定义传输用于:自定义网络协议专用通信通道与现有系统集成性能优化TypeScriptonclose?onerror?onmessage?原创 2025-03-23 21:48:29 · 1155 阅读 · 0 评论 -
TensorFlow快速介绍
TensorFlow 是由 Google 开发的开源机器学习框架,广泛用于深度学习、数值计算和数据处理。其核心基于(节点表示操作,边表示多维数据数组“张量”),支持灵活部署(CPU/GPU/TPU、移动设备、浏览器等)。使用pip安装过程界面如下:安装完成的界面如下:tf.print()原创 2025-03-22 20:34:18 · 2130 阅读 · 0 评论 -
CUDA与cuDNN 的介绍
CUDA(Compute Unified Device Architecture)是NVIDIA推出的并行计算平台和编程模型,允许开发者利用GPU的强大计算能力进行通用计算。原创 2025-03-20 22:27:05 · 1013 阅读 · 0 评论 -
大模型之蒸馏模型
蒸馏模型(Distilled Model)是一种通过知识蒸馏(Knowledge Distillation)技术训练得到的轻量级模型,其核心思想是将一个复杂的大模型(称为教师模型)的知识“迁移”到一个更小、更高效的模型(称为学生模型)中。这种方法可以在保持较高性能的同时,显著减少模型的参数量和计算资源需求。核心原理教师模型(Teacher Model)教师模型通常是一个参数量大、性能强的复杂模型(例如深度神经网络),但计算成本高,难以部署在资源受限的环境(如移动端)。原创 2025-03-20 21:26:26 · 1091 阅读 · 0 评论 -
MCP(Model Context Protocol)的介绍与开发初体验
Model Context Protocol, 模型上下文协议,是一种开放协议,用于标准化应用程序向大型语言模型(LLM)提供上下文的方式。可以将 MCP 视为 AI 应用的 USB-C 接口:正如 USB-C 为设备连接各种外设和配件提供了标准化方式,MCP 也为 AI 模型连接不同数据源和工具提供了统一标准。原创 2025-03-19 23:04:10 · 1485 阅读 · 0 评论 -
LanceDB快速入门之基本操作与API一览
LanceDB可以以多种方式运行可以嵌入到现有后端(如您的 Django、Flask、Node.js 或 FastAPI 应用程序)中直接从如 Jupyter 笔记本等客户端应用程序中用于分析工作负载部署为远程无服务器数据库。原创 2025-03-12 23:25:27 · 1005 阅读 · 0 评论 -
Node JS 调用模型Xenova_all-MiniLM-L6-v2实战
Transformers 是由 Hugging Face 团队开发的开源 库,专注于提供基于 Transformer 架构 的预训练模型和工具。它简化了自然语言处理(NLP)任务的实现流程,支持文本生成、翻译、分类、问答等场景,并兼容 PyTorch、TensorFlow 等深度学习框架。Transformers 有Python 和 NodeJS 两个版本。如果Hugging Face无法访问Python 版本可以使用ModelScope提供的库NodeJS。原创 2025-03-05 23:32:34 · 1054 阅读 · 0 评论 -
一篇吃透模型:all-MiniLM-L6-v2
MiniLM 是什么?MiniLM 是微软研究院开发的一种轻量级的语言模型,旨在以较小的参数量和计算成本实现与大型语言模型(如 BERT)相当的性能。它是基于 Transformer 架构的预训练模型,通过深度自注意力蒸馏(Deep Self-Attention Distillation)等技术进行压缩和优化,使其能够在资源受限的环境下高效运行。主要特点轻量级:MiniLM 显著减少了模型的参数量和计算成本,使其能够在移动设备、嵌入式系统等资源受限的环境下运行。高性能。原创 2025-03-03 23:10:23 · 2259 阅读 · 0 评论 -
RAG(检索增强生成)快速入门
Karate 作为英文单词翻译过来的意思是:空手道,不过这里的Karate 和日本无关,和李小龙也没有关系, 而是一个API的测试框架。Karate框架遵循Cucumber风格的编程方式,这种方式遵循行为驱动开发(BDD)的方法。非编程人员也能轻松理解其语法。这个框架是唯一一个将API自动化测试和性能测试结合成一个独立工具的API测试工具。Karate是一个BDD(行为驱动开发)测试框架,而不是TDD(测试驱动开发)。它被设计为对非程序员友好。原创 2025-02-26 22:18:41 · 522 阅读 · 0 评论 -
交互编程工具之——Jupyter
简单来说, Jupyter Notebook 的作用就是你不需要在IDE编写代码和运行, 而可以直接在网页上编写代码并运行, 这个网页除了代码之外,还可以记录一些其他的文字,类似于一个包含文字和代码的笔记,但是这些代码是可以直接运行的。),允许用户在一个基于浏览器的界面中编写代码、运行代码、可视化结果,并添加富文本(如 Markdown)进行说明,形成可重复、可分享的文档。Jupyter 是数据科学家的“瑞士军刀”,将代码、文档和可视化整合在一个界面中,极大提升工作效率和可复现性!安装需要等待一段时间,原创 2025-02-20 23:17:26 · 1359 阅读 · 0 评论 -
AI向量数据库之LanceDB快速介绍
LanceDB 是一个开源的向量搜索数据库,具备持久化存储功能,极大地简化了嵌入向量的检索、过滤和管理。安装完成后,你可以在项目中引入 LanceDB 并使用其 API 进行向量存储、查询和管理。第二个参数是一个数组,表示要插入的初始数据。LanceDB 的核心是用 Rust 🦀 编写的,并基于 Lance 构建。如果路径不存在,LanceDB 会自动创建。变量中,通常是一个包含相似向量数据的数组。变量中,通常是一个符合条件的数据数组。原创 2025-02-13 23:03:55 · 2680 阅读 · 6 评论 -
DeepSeek大模型系列
如果需要使用DeepSeek 做一些批量或进阶的事情,则需要使用调用API的方式。这里还需要加上最近发布的DeepSeek-R1 模型(2025/01/20 发布)以上两种方式注册账号就可以,使用是免费的。原创 2025-02-03 13:35:30 · 2762 阅读 · 0 评论