自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小工匠

show me the code ,change the world

  • 博客(2503)
  • 资源 (12)
  • 收藏
  • 关注

原创 小工匠聊架构文章一览【不间断持续更新】

文章摘要 本文系统梳理了微服务架构与分布式技术的核心知识体系,包含三大板块: 微服务布道系列:详细解析从单体架构到服务化的演进路径,涵盖服务注册发现、RPC调用、监控追踪等12个核心主题; 分布式理论篇:深入剖析CAP定理、BASE理论、Paxos算法等分布式系统基石理论; 分布式实战篇:聚焦事务、服务、缓存、存储四大场景,提供两阶段提交、TCC模型、热点key治理等20余种解决方案。文中配有清晰的技术架构图,每个主题均附详细技术文章链接,形成完整的技术图谱。

2020-11-12 00:01:55 89342 10

原创 大规模数据处理:06_分布式系统架构师必知的三大指标_扩展性、一致性与持久性

本文深入探讨了分布式系统的三大核心指标:扩展性、一致性和持久性。在扩展性方面,分析了水平扩展和垂直扩展的优缺点及适用场景,指出NoSQL数据库的兴起解决了传统关系型数据库难以水平扩展的问题。一致性部分详细比较了强一致性、最终一致性和因果一致性等模型,结合微信朋友圈评论等案例说明不同场景下的选择策略。持久性章节则从单节点、集群级和消息级三个维度解析技术实现方式。文章强调分布式系统设计需要权衡各项指标,结合实际业务需求进行取舍,为架构师提供了实用的技术洞察和设计思路。

2025-11-24 06:00:00 186

原创 大规模数据处理:05_分布式系统服务等级协议(SLA)实战评估与优化

本文系统解析了分布式系统中SLA(服务等级协议)的核心指标与优化方法。SLA作为衡量服务质量的关键标准,涵盖可用性、准确性、系统容量和延迟四大核心指标。文章详细阐述了各指标的计算方法、行业标准及优化路径,并提供了限流、性能测试等实用工具案例。同时强调SLA设计需结合业务实际,避免理想化目标,通过分阶段测试、日志分析和架构演进持续优化。最终指出,科学定义和动态优化SLA是保障系统稳定性、提升用户体验的关键驱动力。

2025-11-24 05:15:00 878

原创 大规模数据处理:04_大规模数据处理实战_从电商热销榜到分布式架构设计

本文系统介绍了大规模数据处理技术的演进路径与实践方案。以电商热销榜系统为例,从单机算法到分布式架构再到自动化框架,详细分析了不同数据规模下的技术选型。重点阐述了分布式销量统计、Top K算法、结果汇总等核心环节的设计思路,并总结了内存瓶颈、数据倾斜等常见挑战的解决方案。文章还探讨了现代数据处理框架的抽象化趋势,以及行业实践中的关键技术考量。通过具体案例和技术解析,为开发者提供了应对PB级数据处理的系统性方法,强调规模化思维对现代系统设计的重要性。

2025-11-23 18:00:00 348

原创 大规模数据处理:03_下一代大规模数据处理技术设计

本文探讨了大规模数据处理技术的演进趋势。随着数据规模膨胀和业务复杂度提升,传统MapReduce暴露出维护困难、性能瓶颈等问题。新一代技术聚焦DAG抽象、自动优化、批流统一等核心方向,如Apache Spark、Flink和Beam等框架通过解耦数据流程与运算、支持弹性资源分配、统一批流处理API等创新,显著提升性能与易用性。典型案例表明,这些技术能有效应对电商风控、海量文件处理等场景需求。未来,开发者应结合开源生态和云原生能力,构建更高效可靠的大数据处理系统。

2025-11-23 13:45:00 16

原创 大规模数据处理:02_大规模数据处理技术深度解析

MapReduce曾是大数据处理的革命性技术,但随着数据规模激增和业务需求变化,其高维护成本、性能瓶颈和扩展性不足等问题日益凸显。Google等公司已转向FlumeJava/Apache Beam等新一代框架,实现批流统一、简化运维并提升性能。本文剖析MapReduce被淘汰的核心原因(如复杂任务链、调优困难),对比Spark等技术的优势,并展望批流融合、可测试性等未来趋势。开发者需拥抱Apache Beam等现代框架,适应技术范式升级,以应对实时分析、数据湖等新兴场景的挑战。

2025-11-23 09:15:08 714

原创 大规模数据处理:01_一线架构师的实战路径与技术洞察

摘要 在数字经济时代,高效处理大规模数据是支撑AI、互联网和企业数字化转型的核心能力。然而,许多开发者低估了数据处理的复杂性,或盲目追逐技术潮流而忽视适用性。本文系统梳理了行业痛点与技术误区,强调数据质量对AI落地的关键作用,并指出技术选型需以业务场景为导向。通过分析MapReduce、Spark、Beam等技术的演进规律,提出“灵魂五问”方法论,倡导从原理出发的架构思维。未来,开发者需持续关注技术演进,结合业务需求提升数据处理能力,培养技术领导力与跨界协作意识,以应对数据驱动的挑战与机遇。

2025-11-23 09:06:46 1073

原创 LLM - 六大核心组件构建智能 Agent 的上下文系统(Context Engineering)

上下文工程:大语言模型落地的关键桥梁 在大语言模型(LLM)应用中,上下文工程通过六大核心组件(Agent决策、查询增强、检索系统、提示工程、记忆系统、工具集成)解决模型与现实的连接瓶颈。其核心是动态编排信息流,整合外部数据与工具,实现智能系统的可靠决策与多轮交互。相比传统提示工程,上下文工程更注重架构设计,支持复杂任务场景。开发者需关注信息流转质量、分块优化和混合记忆策略,避免过度依赖模型本身能力。未来,Agent工程与RAG技术将成为AI落地的关键方向。

2025-11-21 18:00:00 1067

原创 LLM - AI智能体(AI Agent)设计实战全解:核心要素、架构剖析与落地实践

本文系统阐述了AI智能体的设计原理与实现方法。首先指出AI智能体的核心价值在于业务流程自动化、个性化决策支持和复杂环境适应能力。接着详细解析了智能体架构的四大核心模块:认知引擎(模型选型与参数配置)、任务规划器(目标拆解)、工具集成(外部能力增强)和记忆模块(上下文管理)。文章提供了技术选型建议,并以旅游助手为例展示了开发流程,包括意图识别、任务拆解、工具调用和记忆编排。最后总结了常见误区,并展望了多智能体协同、场景自适应进化等未来趋势。全文为开发者提供了构建高效AI智能体的实用指南。

2025-11-21 10:30:50 978

原创 LLM - 大模型与计算机视觉融合:Skyvern核心技术架构揭秘

Skyvern是一款融合大语言模型和计算机视觉的开源网页自动化工具,通过AI智能体协作实现自然语言驱动的网页操作。它突破了传统自动化工具依赖DOM选择器的局限,采用Planner、Task、Validator三模块架构,使AI能像人类一样"看懂"网页并完成复杂任务。相比传统方案,Skyvern具有更强的泛化能力和稳定性,在WebBench测试中成功率超过60%。支持Python API和Docker部署,适用于数据采集、RPA自动化等场景。该项目代表了AI赋能的下一代自动化技术方向,显著

2025-11-20 06:00:00 1606

原创 Vibe Coding - Claude Code实战使用技巧深度解析与应用实录

摘要:Claude Code作为Anthropic推出的AI编程助手,通过自然语言处理技术实现智能代码辅助。文章详解其核心功能:/init命令自动建立项目知识库,/compact优化对话效率,/clear重置上下文;介绍IDE集成与对比修改功能;分享think系列Prompt提升思考深度,以及命令行模式和长期记忆管理。还包含MCP Server集成方法,并通过案例展示Claude Code如何优化微服务项目开发全流程,实现知识沉淀和高效协作。该工具通过智能化命令体系推动AI驱动开发的创新实践。

2025-11-20 05:00:00 1271

原创 LLM - Model Context Protocol(MCP)底层解析与实战指南

近年来,大语言模型(LLM)给各行各业带来变革。但原生LLM受限于静态知识库和有限外部能力,实用性面临天花板。如何让LLM“动手做事”,实现**实时数据获取与工具协作**,一直是AI工程领域的关键课题。

2025-11-19 21:55:20 848

原创 LLM - MCP安全陷阱深度剖析:揭示Agentic工作流中的隐形风险

MCP协议安全风险分析及防护实践 本文深入探讨了Model Context Protocol(MCP)在Agentic工作流中面临的新型安全威胁。随着MCP成为连接AI智能体与外部工具的核心协议,攻击者瞄准了工具定义注入、供应链"拉地毯"攻击、跨服务器影子攻击等关键漏洞。43%的公开MCP服务器存在不安全代码执行问题,可能被利用实施数据窃取或智能体接管。文章详细分析了五种典型攻击手法,包括工具描述隐藏指令、权限滥用和经典代码注入等,并提供防护建议:建立"零信任"原则、

2025-11-19 21:35:10 1054

原创 大模型开发 - Spring AI MCP 工具分组系统:细粒度权限控制的优雅实现

Spring AI MCP项目创新性地实现了工具分组系统,通过三层权限验证机制确保AI工具的安全访问控制。系统核心包括:请求层的ApiKeyWebFilter进行API密钥验证和分组映射,注册层通过GroupAwareToolCallbackProvider预计算工具权限映射实现O(1)查找,执行层由ToolGroupExtractorCallback进行细粒度权限校验。客户端设计采用UniversalToolInvoker统一路由和自动注入权限元数据,配合YAML配置的多API密钥认证和灵活分组定义,在保

2025-11-17 21:53:12 1357

原创 大模型开发 - Spring AI MCP:构建通用UniversalToolInvoker实现服务端工具调用

本文介绍了一个基于Spring AI 1.1.0的MCP客户端实现方案,通过UniversalToolInvoker模式构建标准化工具调用机制。系统采用Spring Boot 3.5.7、WebFlux响应式编程等技术栈,实现了工具分组访问控制、多API Key认证等关键特性。核心组件UniversalToolInvoker采用装饰器模式,提供统一接口和安全隔离,利用ThreadLocal管理会话级工具分组。该设计实现了MCP协议下的标准化通信,为AI应用中工具调用提供了高效安全的解决方案。

2025-11-17 21:48:40 1100

原创 LLM - User Prompt与System Prompt原理、方法与实战

摘要: Prompt工程通过结构化指令(User Prompt与System Prompt)精准控制AI输出,是提升大模型交互效率的核心技术。User Prompt聚焦具体任务(如代码审查、表格生成),而System Prompt预设AI角色与行为边界(如医学顾问规范)。二者协同优化需遵循RTF结构(角色-任务-格式)、细节约束及版本管理。行业实践表明,结合自动化工具(如PromptPerfect)和Prompt库建设,可显著提升AI在客服、财务等场景的落地效果。避免堆砌指令、注重持续迭代是关键,Promp

2025-11-15 07:29:44 1211 1

原创 LLM -理解LLM、RAG、AI Agent:三层架构的本质、工程落地与应用范式

本文探讨了LLM(大型语言模型)、RAG(知识增强检索生成)和Agent(AI智能体)三者在AI系统中的协同关系。LLM作为AI大脑提供自然语言理解与生成能力;RAG通过外部知识检索增强AI的事实准确性;Agent则赋予AI多步骤决策和任务执行能力。文章分析了各层级的工程挑战与优化方案,如RAG的混合检索策略和Agent的防死循环机制,并提供了企业客服、智能出行等实际案例。核心观点认为三者并非替代关系,而是应根据场景需求分层组合,逐步演进系统架构。最后强调AI产品开发应遵循"理解-知识-行动&qu

2025-11-15 07:17:51 1241

原创 Vibe Coding - Claude Code与CLAUDE.md文件:AI编程助手的“长期记忆”机制全解

CLAUDE.md是Claude Code AI编程助手的核心配置文件,采用Markdown格式存储项目记忆信息,包含编码规范、API约定等关键数据。该系统支持多层级配置,遵循"企业>项目>个人"的优先级规则,实现智能化的团队协作。文件内容会自动加载为AI的长期记忆,辅助代码分析和问题解决。最佳实践建议采用标准化结构,并通过版本管理保障团队同步。未来发展方向包括语义理解增强和跨平台记忆共享。CLAUDE.md作为AI辅助开发的关键基础设施,为技术团队提供了智能化协作的新范式。

2025-11-14 05:45:00 796

原创 Vibe Coding - awesome-claude-skills_重塑你的 AI 工作流

Claude Skills 是由 ComposioHQ 维护的技能集合,旨在提升 Claude AI 平台的生产力和定制化能力。该仓库提供涵盖文档处理、代码开发、数据分析、创意设计、协作管理等领域的多种技能插件,支持开箱即用。技能可帮助 Claude AI 在不同平台以统一方式完成特定任务,例如生成专业文档、优化代码质量、分析数据、设计创意内容等。用户可通过 Cludae.ai 平台、Claude Code 或 API 集成使用这些技能。此外,开发者也能通过规范模板创建自定义技能,进一步扩展 AI 功能。开

2025-11-14 04:45:00 1927

原创 Vibe Coding - 从Vibe Coding到Spec Coding_AI编码范式的进化之路

本文探讨了AI编程从"氛围驱动"(Vibe Coding)到"规范驱动"(Spec Coding)的演进过程。早期开发者通过模糊描述让AI猜测需求,效率低下;现在通过结构化规格说明(如YAML格式的需求定义),能直接生成高质量代码。重点介绍了三大规范驱动开发工具:GitHub的Spec-Kit提供全流程结构化开发;OpenSpec实现AI与人类协同;Spec-Workflow MCP支持团队协作与进度追踪。这些工具推动"规范→代码生成→测试→迭代

2025-11-13 15:40:06 1021 1

原创 Vibe Coding - 解析awesome-claude-code-subagents:百款 Claude 专属 AI SubAgent

摘要: awesome-claude-code-subagents 是一个面向 Claude Code 编程环境的开源 AI 子专员集合,提供 100+ 经过真实场景测试的生产级 subagents,覆盖全栈开发、运维、数据科学等多元领域。项目支持细粒度权限配置(如代码读写、Bash 执行等)与独立上下文隔离,用户可通过简单文件配置实现快速部署,或自定义专属 subagent。其模块化设计允许开发者灵活调用领域专家,显著提升开发效率与协作智能化水平。目前项目已获 4600+ Star,社区持续迭代更新。 关

2025-11-13 05:15:00 1020

原创 Vibe Coding - CodexMCP:让 Claude Code 与 Codex 无缝协作的 AI 编程新范式

CodexMCP是一款开源AI编程协作工具,旨在实现Claude Code与Codex的高效协同。通过MCP协议,它整合了Claude Code的需求分析、架构规划能力与Codex的代码生成、优化功能,支持多轮对话、持久化会话和并行任务调度。相比官方版本,CodexMCP新增推理追踪、错误处理等企业级特性,提供更稳定的开发体验。安装简便,支持跨平台使用,开发者可专注业务逻辑,由工具智能调度AI分工。项目遵循MIT协议,鼓励社区贡献,为AI辅助编程提供全新协作范式。

2025-11-12 06:15:00 1197

原创 Vibe Coding - ccNexus_智能 Claude Code 端点轮换代理

ccNexus是一个智能API代理工具,支持Claude、OpenAI、Gemini等多供应商接口。核心功能包括自动端点切换、智能重试、负载均衡和Token用量统计,可显著提升API调用的稳定性和可用性。提供跨平台桌面GUI,采用Wails框架开发,支持Windows/macOS/Linux系统。通过代理机制实现请求自动分发和错误处理,适合需要多API接入、稳定性要求高的场景。项目开源且商用友好,欢迎开发者参与贡献。

2025-11-12 05:00:00 861

原创 Vibe Coding - Claude Code 深度实践

摘要:Claude Code 高级功能与最佳实践指南 本文系统梳理了 Claude Code 的核心功能与深度应用技巧。重点包括:CLAUDE.md 作为精简高效的规则基线;上下文管理的三种策略(避免自动压缩);斜杠命令的极简设计原则;主-克隆模式的子代理分工优势;以及大型项目必备的 Plan 模式规划方法。文章强调工具配置要与工程实践深度结合,通过技能脚本化、钩子机制和日志分析形成自我改进闭环。最终指出,真正的优化不在于工具本身,而在于团队如何将 AI Agent 深度整合到自动化研发流程中(约148字)

2025-11-11 06:00:00 1036

原创 Vibe Coding - cc-switch 桌面应用_让Claude Code 与 Codex 配置切换更简单

《cc-switch:多供应商LLM编程助手配置管理工具》摘要:cc-switch是一款专为管理Claude Code和Codex等LLM编程助手多供应商配置而开发的跨平台桌面应用。该工具支持Windows、macOS和Linux系统,采用Tauri框架构建,具有轻量高效的特点。核心功能包括:一键切换不同供应商API配置、MCP服务器管理、端点速度测试、配置备份恢复及国际化支持。通过可视化界面,开发者可方便地对比和管理多个供应商的密钥、端点等配置,显著提升工作效率。项目已开源,支持插件扩展和团队协作场景,适

2025-11-11 04:45:00 1041

原创 Vibe Coding - Claude Code Subagents详解_原理、配置与实践

文章摘要 Claude Code平台的子代理(Subagent)功能通过专业化AI助手实现高效协作。每个子代理专注于特定领域(如代码审查、调试、数据分析),具有独立上下文和精细化工具权限配置。主要优势包括上下文保护、专业化处理、高复用性和权限控制。配置方式采用Markdown+YAML格式,支持项目级和用户级代理,可根据任务自动或显式调用。典型应用包括代码审查员(检查质量与安全)、调试专家(根因分析)及数据科学家(SQL/BigQuery操作)。该功能显著提升开发效率与任务处理专业性。

2025-11-10 06:00:00 2147

原创 Vibe Coding - Vicoa:让你随时随地高效编程的 Claude Code / CodeX 工具

Vicoa是一款跨平台AI编程助手,支持Claude Code和Codex,提供移动端和网页版便捷编码体验。核心功能包括跨设备同步、AI代码审核和推送通知,实现"随时随地编程"。安装仅需一条命令(pip install vicoa),启动后台服务即可在手机、平板和电脑间无缝切换工作。典型场景包括通勤时手机调试、平板审核代码等,显著提升开发效率。官网提供详细文档(iOS已上架,安卓需申请测试)。

2025-11-10 05:15:00 1219

原创 LLM - 上下文工程(Context Engineering):从原理到实践

摘要: 上下文工程是AI智能体开发的核心技术,通过系统管理模型可访问的信息空间(系统提示、对话历史、长期记忆等),使其从“理解”升级到“执行”。相比传统提示词工程,它更关注动态信息调度与质量优化,解决长上下文导致的记忆衰减、污染等问题。四大核心策略包括写入(存储)、选择(过滤)、压缩(精简)和隔离(分治)。业界实践如Claude Code的三层记忆架构和Manus的KV缓存优化展示了高效上下文管理方案。掌握上下文工程能构建有记忆、可执行的智能体系统,是AI开发的新方向。

2025-11-09 07:00:00 1690

原创 LLM - 构建基于规则引擎 + Agent + LLM 的行为风险监测架构设计

企业安全运营中的智能行为监测系统融合了规则引擎与语义分析能力,通过三层架构实现高效风险判定。系统采用规则引擎进行硬性检测确保确定性,利用大模型层分析行为意图,并由Agent层动态调度任务与融合结果。预处理模块对日志进行脱敏和结构化处理,规则引擎执行静态判断,大模型提供语义解释,最终通过置信度算法聚合风险等级。该系统在保证安全审计性的同时,实现了自动化、可解释的风险分析,有效解决了传统方案在事件爆炸和上下文缺失方面的困境。

2025-11-09 05:45:00 1602

原创 Vibe-Coding Workflow: AI-Powered MVP Development 打造AI驱动的MVP应用

摘要: Vibe Coding推出的AI研发框架通过标准化流程(调研→PRD→技术设计→AI指令→编码),结合Claude/Gemini等AI代理工具,实现数小时内完成应用原型开发。项目提供结构化模板(research/PRD/TechDesign文件)和AI配置(如CLAUDE.md),支持从需求分析到代码生成的全闭环开发,显著提升个人及团队的MVP落地效率。其核心价值在于:规范化文档输出、最新AI工具适配、五步极速交付,助力开发者快速验证产品创意。

2025-11-08 07:00:00 1656

原创 Vibe Coding - 规范驱动AI协作:深入解析OpenSpec改变开发流程的力量

本文介绍了OpenSpec这一AI规范驱动开发辅助工具。OpenSpec通过规范驱动的方式,将需求以轻量spec管理,实现开发过程的可控、可审计和可追溯。其核心工作流包括变更提案、审核协同、任务实现和归档更新四个步骤,采用Delta规范格式记录变更内容。相比其他方案,OpenSpec在新旧项目中均适用,具有明确的需求追踪和强协作性。文章还提供了安装配置指南,并以"两步验证"功能为例,详细展示了从创建提案到任务拆解的实现过程,帮助开发者高效落地AI驱动的规范开发。

2025-11-08 05:45:00 1402

原创 Vibe Coding - 免费使用claude code 、gpt-5、grok-code-fast-1进行氛围编程

摘要:AgentRouter是一个公益AI编程平台,旨在降低开发者接入AI工具的难度。它支持多种主流工具(如Claude Code、Codex等),提供免费额度,实现一站式对接。通过自然语言交互(Vibe Coding),开发者可快速生成和优化代码,无需深入理解底层实现。典型应用包括自动编程、智能问答和数据分析。平台提供详细接入文档,简化配置流程,助力开发者高效利用AI技术,特别适合原型开发和技术门槛较低的项目。

2025-11-07 20:29:23 2712 7

原创 Vibe Coding - Claude Code Viewer:打造更高效的本地 Claude Code 可视化体验

Claude Code Viewer 是一个由社区开发者 d-kimuson 创建的 基于 Web 的 Claude Code 可视化客户端,用于在浏览器中全面管理和分析 Claude Code 项目的交互日志与开发会话。它的设计理念是 “零数据丢失 + 有效组织 + 远程友好”,旨在让开发者能够通过现代化界面查看历史会话、继续中断的任务、执行 Git 操作、上传文件以及监控系统状态。

2025-11-07 06:15:00 1094

原创 Vibe Coding - Claude Code Infrastructure 从技能自动激活到智能开发工作流

Claude Code基础设施:构建自动化的AI开发辅助系统 Anthropic推出的Claude Code系统通过"技能+钩子+代理"架构,旨在实现AI助手对开发流程的主动介入。该项目提出了一套完整的工程化解决方案,核心机制包括: 自动激活:通过Hook监听用户输入触发对应技能 模块化设计:技能采用500行分割原则,动态加载资源 协同运作:Hooks实现事件监听,Agents处理特定任务,Commands标准化交互 该架构将AI从被动应答转变为主动协作,未来可能成为AI IDE的标准配

2025-11-07 05:00:00 1874

原创 大模型开发 - 47 Advisor:架构深度解析_从 AOP 到自定义实现

摘要:本系列文章全面介绍了Spring AI在大模型开发中的应用实践,涵盖从基础概念到高级功能的完整技术栈。主要内容包括:Spring AI核心特性与概念解析、DeepSeek/阿里百炼等平台集成方案、Ollama本地模型部署实战、ChatClient接口设计与流式响应实现、多轮对话记忆管理、结构化输出转换、多模态API应用、工具调用工作机制及最佳实践。同时深入探讨了Model Context Protocol(MCP)架构、RAG增强生成技术以及智能体开发模式,为构建统一、灵活的大模型应用系统提供完整解决

2025-11-06 06:00:00 1760

原创 LLM - 理解 OpenAI API 参数:从 Completion 到 Chat 的演进

本文系统解析了OpenAI API参数的核心机制与应用。从Completion API到Chat API的演进,重点讲解了Chat模型中temperature(控制输出随机性)、top_p(概率采样)、seed(结果可复现)、max_tokens(输出长度限制)等关键参数的作用原理及最佳实践。通过参数组合可调控模型输出的严谨性、创造力和一致性,适用于代码生成、创意写作等不同场景。文章还提供了参数调优对比实验和常见问题解决方案,帮助开发者更高效地使用大语言模型API。掌握这些参数调节技巧,能显著提升语言模型的

2025-11-06 05:15:00 1190

原创 LLM - Prompt攻击与防护实践

摘要:本文探讨了AI大模型面临的Prompt攻击风险及防护策略。Prompt攻击指通过特殊输入诱导AI系统偏离预期行为,如"奶奶漏洞"和角色扮演干扰。主要防护措施包括:1)Prompt注入分类器,通过关键词识别拦截恶意输入;2)输入前置硬性约束,强制声明系统限制来防止角色重置。最佳实践强调需平衡安全与体验,持续跟进前沿防护方案。研究表明,优化Prompt分类和约束机制对保障AI系统安全至关重要,需要在开放应用与系统防护间寻找平衡点。(149字)

2025-11-05 06:00:00 651

原创 Spring AI : 探秘 SpringAI 架构解析

**Spring AI Alibaba为Java开发者提供了企业级AI集成解决方案,通过统一API实现多模型切换、Prompt工程和流式响应等核心功能。其迭代历程从2024年公测到2025年生产版本,逐步完善了RAG、对话记忆、多模态等模块。架构上分为应用层、集成层、核心层和扩展层,支持微服务快速接入AI能力。适用于知识库问答、智能对话等生产场景,尤其适合需要灵活切换不同AI供应商的Java生态项目。该框架定位明确,作为AI服务中转层为业务系统提供高效赋能。

2025-11-05 05:00:00 1081 1

原创 Vibe Coding - 深度解读规范驱动开发(SDD):对 Kiro、spec-kit、Tessl 三大工具的剖析与实践

本文探讨了生成式AI时代兴起的规范驱动开发(SDD)理念与实践。文章首先定义SDD为"基于规范文档的AI辅助开发",并划分规范优先、规范锚定和规范即代码源三个演进层级。通过分析Kiro、spec-kit和Tessl三款主流SDD工具的核心工作流与特点,指出当前工具在规范评审效率、技术业务分离、团队协作等方面存在的挑战。文章强调SDD实践需根据项目规模与团队特点谨慎选择,避免因过度追求"规范重"而适得其反。最后指出SDD尚处早期探索阶段,其实际效果仍需更多实战验证。

2025-11-04 05:45:00 1469

原创 LLM - AI-Video-Transcriber:用 Faster-Whisper 高效实现多语言视频自动转写

AI视频转录器是一款支持多平台的智能转录工具,具备30+视频平台兼容性(如YouTube、B站、抖音)。核心功能包括高精度语音转文字(基于Faster-Whisper模型)、AI文本优化(自动纠错/分段)、多语言摘要生成及条件式翻译(当转录与摘要语言不一致时自动调用GPT-4o)。提供三种部署方式:自动安装脚本、Docker容器化部署(推荐)和手动安装,需配置Python 3.8+和FFmpeg环境。采用FastAPI后端架构,支持实时进度追踪,特别优化了长视频处理稳定性。用户可通过网页界面便捷完成视频链接

2025-11-04 04:45:00 1903

Redis 8.2.2 windows-x64

Redis 8.2.2 windows-x64

2025-10-18

Redis 8.0.3 是高性能的 Key-Value 缓存数据库,本版本为社区适配的 Windows 平台编译版本,适用于开发环境或测试用途

Redis 8.0.3 基于官方 Linux 源码移植编译,具有以下特点: 高性能:基于 IOCP(I/O Completion Ports)异步模型,充分利用多核和异步网络能力。 易部署:提供单一可执行文件,无需额外依赖,支持以服务模式运行。 开发友好:与 Linux 版本协议兼容,可在本地 Windows 环境进行功能测试与性能验证。

2025-07-12

版本 8.0.3 国产4种架构 x86arm64loongarchmips

## 8. 通用四种架构支持 ### 8.1 x86(Intel / AMD) * **架构类型**:标准 x86\_64(也兼容 x86\_32,编译时默认关闭 32 位) * **OS 支持**:主流 Linux 发行版(CentOS、Ubuntu、Debian)、Windows(社区版) * **编译选项**: ```bash make BUILD_TLS=openssl CFLAGS="-march=x86-64-v2 -O2" LDFLAGS="" ``` * **优化建议**: * 启用 `jemalloc`:`make BUILD_TLS=openssl MALLOC=jemalloc` * 开启 CPU 指令集优化:`-march=x86-64-v3` 或更高 * 调整 `tcp-backlog`(如 4096)与 `net.core.somaxconn` 系统参数 * **注意事项**: * Windows 社区版仅支持 x86\_64,可用命令行模式或服务模式运行 * 在老旧 CPU(不支持 AES-NI)上,AOF 加密和 SSL 性能会受影响

2025-07-11

国产 四种架构 Keepalived

国产 四种架构 Keepalived

2025-07-11

Redis 7.4.1 Windows 版本

Redis 7.4.1 Windows 版本

2024-10-10

「Tomcat源码剖析」.pdf

Tomcat源码剖析 : 整体架构 层层分析 源码解析 架构分析 (Http服务器功能:Socket通信(TCP/IP)、解析Http报文 Servlet容器功能:有很多Servlet(自带系统级Servlet+自定义Servlet),Servlet处理具体的业务逻辑)

2020-06-01

Scalable IO in Java

NIO - Scalable IO in Java

2023-11-10

腾讯万亿级 Elasticsearch 架构实践

腾讯万亿级 Elasticsearch 架构实践

2023-07-24

实时分析引擎&实时分析引擎

实时分析引擎

2023-07-24

MQ对比:Kafka VS Rocketmq VS Rabbitmq.pdf

MQ对比:Kafka VS Rocketmq VS Rabbitmq 超详细 ,值的收藏,参考资料

2019-11-04

elasticsearch-analysis-ik-6.4.1.zip

修改ik分词器源码,支持从mysql中每隔一定时间,自动加载新的词库

2019-08-20

中标龙芯-MIPS- NFS rpm包

gssproxy-0.7.0-4.ns7_4.mips64 keyutils-1.5.8-3. libbasicobjects-0 libcollection-0.6 libevent-2.0.21-4 libini_config-1.3 libnfsidmap-0.25- libpath_utils-0.2 libref_array-0.1. libtirpc-0.2.4-0. libverto-libeventm nfs-utils-1.3.0-0m quota-4.01-14.ns7 quota-nls-4.01-14 rpcbind-0.2.0-42. tcp_wrappers-7.6

2020-11-24

X86-NFS rpm包

gssproxy-0.7.0-21.el7.x86_64.rpm keyutils- libbasicobjects-0 libcollection-0.6 libevent-2.0.21-4 libini_config libnfsidmap libpath_utils-0.2 libref_array-0.1. libtirpc-0.2.4-0. libverto-libeventm nfs-utils-1.3.0-0m quota-4.01-14.ns7 quota-nls-4.01-14 rpcbind tcp_wrappers

2020-11-24

apache-tomcat-8.5.50-src.zip

Tomcat启动流程分析 组件的生命周期管理 用Lifecycle管理启动、停止、关闭 Lifecycle接口预览 几个核心方法 Server中的init方法示例 为啥StandardServer没有init方法 LifecycleBase中的init与initInternal方法 为什么这么设计? 分析Tomcat请求过程 链接器(Connector)与容器(Container) 解耦 Connector设计 监听服务端口,读取来自客户端的请求 将请求数据按照指定协议进行解析 根据请求地址匹配正确的容器进行处理 将响应返回客户端 Container设计 Servlet容器的实现。

2020-06-02

Nginx1.14.2 + zlib + pcre + openssl

1. nginx 主软件 和 3个依赖包 zlib + pcre + openssl

2019-03-12

mybatisSource.zip

MyBatis源码功能演示环境 ,演示MyBatis的Executor 、StatementHandler 、 SQL映射、对象转换 等核心功能

2020-06-14

Spring4CachingAnnotationsExample

Spring4CachingAnnotationsExample的示例,通过Java注解的方式整合EhCache框架

2017-10-04

Jest-5.3.4.zip

Jest是Elasticsearch 的Java Http Rest 客户端。 ElasticSearch已经具备应用于Elasticsearch内部的java API,但是Jest弥补了ES自有API缺少Elasticsearch Http Rest接口客户端的不足。 Jest 配置ES 集群 示例代码 及源码解读 - 核心原理 - NodeChecker源码解读 -

2020-01-19

Java反编译工具

jd-gui.exe使用C++开发,主要具有以下功能: 一、支持众多Java编译器的反编译; 二、支持对整个Jar文件进行反编译,并本源代码可直接点击进行相关代码的跳转;

2015-06-04

ORACLE_AWR报告详细分析

ORACLE_AWR报告详细分析

2016-09-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除