阿里巴巴淘系技术团队官网博客-优快云博客

原创淘系技术，实力为2019年双11而战！稳！

今年，双11走到了第11个年头，史无前例的，阿里经济体内有49支技术团队共同参与作战，也是第一次，双11的核心系统将100%跑在云上，这无疑让今年的双11技术作战充满了更大的挑战。正如2019年双11技术团长平畴（汤兴）说的“「善战者，无智名，无勇功」，这是我们技术人最高的境界”。我们一起捍卫了阿里技术人的荣耀，一个字 “稳”！年年双11，回回新玩法，“在吗，盖楼吗？”成为了好友聊天的日常，每天蹲...

2019-11-12 00:38:06 22849 7

原创 GenAI输出内容控制的5种设计模式

当前的做法是在prompt中写清楚需要返回的信息的格式，比如是JSON，或者是一些特殊的sql，虽然Anthropic也推荐了这样的做法，但是这个方式不一定能保证结果格式的输出一定能如你所愿，头部的大模型在模型能力上有比较好的调优，可以在更大概率上遵循用户在prompt中约束的指令，但是小一些的模型，在这方面的表现就会比较差，同时不管是头部闭源模型还是一些自己部署的小模型，在输出格式遵循的确定性上，都是有一定的概率；淘宝直播作为全球领先的直播电商平台，正在重新定义人与商品、人与内容的连接方式。

2026-01-07 18:17:11 452

原创 AI工程vs传统工程 —「道法术」中的变与不变

从“道、法、术”三个层面对比AI工程与传统软件工程的异同，指出AI工程并非推倒重来，而是在传统工程坚实基础上，为应对大模型带来的不确定性（如概率性输出、幻觉、高延迟等）所进行的架构升级：在“道”上，从追求绝对正确转向管理概率预期；在AI工程落地的战场上，我们既未抛弃传统工程的“十八般兵器”，也未盲目迷信AI带来的“新式火器”，而是将二者熔铸为一套既能攻坚克难、又可稳守阵地的复合战法。如果你渴望在真实、高复杂度的业务场景中锤炼AI工程能力，与一群既懂技术又懂业务的伙伴并肩作战，这里将是你理想的舞台。

2026-01-05 17:21:14 948

转载 AI架构师的诞生：AI+传统DDD模式 = 实现开发效率提升75%

根据人工拆解限界上下文部分，从原有 me.ele.newretail.contract.v6.domain 包下，帮我抽象出商品上下文的类，Repo、Service，类用Domain结尾，Repo用DomainRepo结尾，Service用DomainService结尾，输出成表格，包含方法和属性，就放到当前这个文档最后。从上一步可以看出，AI拆解的限界上下文是基于package结构进行拆分，未能深入分析业务语义，这是AI的薄弱环节，需要人工介入修正。这将成为软件工程的新常态。

2025-12-31 17:52:29 46

转载天猫超市数据AI实践总结

从知识库概览图中可以看发现，知识库中强依赖知识间的联动，因此每一次修改都需要联动修改很多绑定部分，并且知识库需避免冗余知识，冗余知识会显著增加模型推理相同问题的不确定性和时间，这不是问数所需要的，因此在人工维护的情况下，无疑是巨大维护成本。总结了在构建面向AI的数据知识库中的实践经验，针对数据资产庞杂、语义不统一、维护成本高等问题，提出以“不重构模型、小而精维护、支持灵活扩展”为原则，通过结构化构建指标、实体、属性、表和字段五类知识，并结合图谱召回与Agent框架，实现自然语言到SQL的智能取数。

2025-12-29 17:15:31 72

原创 AI 辅助前端动画开发

AI 辅助代码生成在前端领域有两个难点，第一个是 Design To Code（下文检查称 D2C），D2C的出发点虽然也是需求文档，但前端拿到的是设计师交付的设计稿，如何将设计软件中的结构化数据映射为准确的前端UI，是目前阶段的一个难点，Pixelator 和 Figma 等团队都在探索。我在 Ani 平台上看到一个简单的进度条 Lottie 动画，背景色渐变的动画还挺好看的，我直接录屏交给微动画研发流程，其他物料都没给，AI 生成了 5 步的 Todo List，并封装好了动画组件。

2025-12-24 17:49:42 1087

转载从代码生成到自主决策：打造一个Coding驱动的“自我编程”Agent

我们在前两个版本的时候，Prompt组装，是没有系统性、结构性设计的，这也就导致了过程中出现了一个900多行的超级大的Prompt，它里面各个位置的内容都是比较乱的。其设计理念来源于人类的大脑分区，我们将Agent的逻辑区域分成了：感知区、认知区、表达区、自我评估区、运动区，将不同种类的Act收纳到Area中，让整个架构体系看着更加的清晰，也让相同能力的动作，可以具备相互沟通的可能。单纯的向量数据库检索，不一定能让经验检索变得准确，我们目前正在向图索引的方向探索，让图谱的能力辅助经验的检索与加工。

2025-12-22 17:48:47 99

原创 SIGGRAPH Asia 2025 | 只用一部手机创建和渲染高质量3D数字人

高保真、可实时驱动、适用于移动端的3D数字人重建与渲染系统。接收，标志着其在学术与工业界前沿水平的认可。阶段采集策略学习的姿态相关的外表建模仍能⽣成。可动画神经表示以及基于⾼斯表示的⽅案。该工作已被计算机图形学顶级会议。系统对采集到的静态序列和动态序列。淘宝技术 — Meta技术团队，淘宝技术 — Meta技术团队。我们撰写的针对移动端的⾼保真实。我们提出了针对移动端的⾼保真实。为了尽量减少⽆效⾼斯的冗余计算。所建模的姿态相关的外表建模能够。为移动端数字⼈应⽤提供了可⾏技。姿态相关的外表建模对于跨姿态。

2025-12-18 18:23:59 951

转载 AI编码实践：从Vibe Coding到SDD

动营销等多样化的业务场景，技术团队面临着需求迭代频繁、代码腐化及团队协作度高的问题，如何提升开发效率、保证代码质量、降低维护成本成为我们面临的重要挑战。正是在这样的背景下，我们开始尝试将AI技术融入到日常开发流程中，探索从传统编码到AI辅助编程的转变之路。带着上面的问题，我们开始尝试Agentic Coding模式，通过编写详细的提示词（Prompt），让AI一次性实现整个功能。我们相信，通过持续的探索和实践，一定能找到更适合团队的AI辅助编程模式，进一步提升开发效率和代码质量。

2025-12-15 17:47:42 241

原创 Jimi：打造Java程序员专属的开源ClaudeCode

作为十年Java老鸟，想为Java开源生态贡献绵薄之力，于是便有了本文：https://github.com/Leavesfly/Jimi。本团队主要负责淘宝行业&淘特C端链路的研发工作，包含：搜索推荐、互动游戏、导购、交易等基础服务，在这里可以探索更多AI场景，包含AI代码生成以及用Agent将电商各种场景重新做一遍的机会。首先是坚实的地基（基础设施），然后是稳定的骨架（核心引擎），再是灵活的功能模块（Agent和工具），最后是友好的交互界面（UI）。Agent中最火的是什么，AI-Coding；

2025-12-10 17:50:26 761

原创 2025淘宝直播双11花花乐动画实现方案思考&分享

关键的问题就是这个动画曲线如何获取，拿到了AE的源文件，能看到设计师手动拉的动画曲线，但是我们拿不到具体的值，自然也构建不了准确的动画曲线。关键的问题就是这个动画曲线如何获取，拿到了AE的源文件，能看到设计师手动拉的动画曲线，但是我们拿不到具体的值，自然也构建不了准确的动画曲线。好在这里有具体的值，我们可以反推公式，不过目前还有个更简单的方案，即直接把每一帧的值带入每一帧的渲染，类似算法中“打表”的方式来执行这个动画曲线。一旦首屏的花渲染完成，开始预加载升级时要用的素材和下个等级的素材。

2025-12-08 17:03:50 697

原创复杂任务AI处理实践：淘宝工程师的实战手记

上游核心表变更时，需要下游逐个查代码确认影响范围。文章总结了一套可复用的方法论——如何将人工操作抽象为"感知-决策-执行"的 AI 闭环，并通过工单处理、数据治理、基线运维等真实案例，展示从"工具助手"到"智能体"的三种自动化模式。精准：在今年的数据治理中，AI处理了数千张表的治理决策，人工复核了10%高优先级的样本，未发现误删数据的情况，不过发现ai策略过度保守的情况存在。数据治理：查表信息及代码 → 看血缘关系 → 读上下游代码 → 查上下游信息 → 评估 → 给出治理方案 → 输出治理建议JSON。

2025-12-01 17:26:38 1112

转载重构一个类，JVM竟省下2.9G内存？

文章深入分析了原始结构的内存浪费原因，并通过实测对比多种方案，验证了新结构在内存效率和查询性能上的优越性，强调了在大数据量场景下应警惕“通用容器”的隐性成本。正是在这一背景下，我们发现：看似合理的“通用集合嵌套”设计，在十万级商品 × 万级城市 × 多标签的规模下，竟成为内存消耗的“沉默杀手”。我们推测，当初的设计者可能是出于“未来扩展性”考虑（例如支持非数字标签），但在当前业务场景下，这种通用性牺牲了巨大的内存效率。在我们的核心业务链路中，存在一个对城市维度下某特定类型商品标签进行动态过滤的关键接口。

2025-11-28 17:22:43 124

原创 AI互动前端开发的思考和实践_

随着AI技术的发展，作者提出一种“规范驱动的AI协同开发”新模式：从“代码复用”转向“规范复用”，即通过制定统一的开发规范（Spec），利用AI按需生成针对具体场景的专用组件。团队在保证业务的同时，以先进的跨端框架和研发模式不断完善自己，打造最极致的体验和工程技术，保障多端设备的适配和稳定运行，并探索端智能等创新机会，通过技术高效驱动业务的良性发展。当AI能够瞬间生成代码时，真正决定交付质量的，不再是某一行语法是否正确，而是我们在需求萌芽之初，是否构建了一套清晰、可演进、可复用的认知框架。

2025-11-24 17:29:15 435

原创代码染色&无效代码清理

但实际做代码下线并非容易，仅凭业务逻辑决策代码清理费时费力，还容易误删在使用的业务代码，因此非常需要工具来辅助做代码的清理，这就是基于代码执行染色和覆盖分析做代码下线方案的背景。离线方案的缺点在于，考虑到插桩代码运行存在性能损耗，如果不是所有在线机器都部署采集，每次部署就需要至少打出两份部署包：插桩版本的包和不做插桩的包，将插桩包部署到需要采集的机器，非插桩包部署到其它机器，这种分别部署的方式增加了部署调度的复杂性。自定义的方式对理解和实践插桩过程很有帮助，比较方便自定义的方式处理采集的数据，但存在问题。

2025-11-21 17:44:15 716

原创交易订单表如何做索引优化

本文首先以淘天电商交易订单表线上一条非典型慢 SQL 的深入剖析为切入点，示范如何系统地分析与排查慢 SQL；接着详尽归纳了索引分类、B+Tree 与 B‑Tree 的结构差异、B+Tree 高度估算方法、EXPLAIN 与 Query Profile 等诊断工具的使用，以及索引下推与排序的执行流程等索引优化理论；最后结合日常实践经验，提出了适用于大规模线上集群的索引变更 SOP，并总结了常见的慢 SQL 成因与相应的解决策略。前言交易订单表（tcorder）用于存储集团电商的在线订单记录，该表近60个字段

2025-11-19 17:15:06 1029

原创页面搭建方案(TurboUIBuilder)在穿搭星球的实践

本文介绍了手淘穿搭星球业务在面对快速迭代和极致用户体验需求时，从初期Weex方案转向Native技术栈，并基于微服务架构设计了TurboUIBuilder这一可视化页面搭建平台。该方案通过三层结构实现页面布局的结构化与动态化，结合DX动态组件、keypath数据绑定协议和内置核心服务（如布局、数据、埋点等），提升了开发效率30%-50%，实现了双端一致性、体验优化开箱即用（如无极缩放转场、多媒体浏览）以及页面的远程动态更新。同时，依托Skyline模板发布平台，支持高效、安全的模板管理与AB测试，最终形成了

2025-11-14 17:17:50 908

转载从0到1：天猫AI测试用例生成的实践与突破

随着大模型的不断演进，测试行业基于AI也在做不同程度的探索，在agent智能体生成方面，基本使用的是prompt+RAG的方式，构建特定业务的需求分析/测试用例生成/数据构造智能体等。其中从用例设计到最终的回归约占据了QA 70%的时间，在当下对于质量要求高，版本节奏快，人力成本缩减的前提下，急需借助大模型来辅助测试设计，建设相关的智能化工具。目前在实践中主要问题还是集中在PRD质量不高；营销解决方案，导购场域，交易结算，多部门协作，中后台，如何针对不同业务类型做用例生成的适配和应用，也是面临的难题之一。

2025-11-10 17:57:07 173

原创让AI打出丝滑连招：编码-部署-自测-改bug

在AI辅助编程的实践中，即使需求理解、方案设计、代码生成都很顺利，AI写出的代码仍不可避免地存在各种小问题。

2025-11-07 18:41:10 1030

转载别让故障复盘流于形式：用AI挖掘每一次“跌倒”的价值

而复盘是让这次故障价值最大化的核心节点，一方面准确深度发现当前系统的风险，并推动当下系统存在的风险闭环解决，同时举一反三将未发生故障&存在同样风险的系统实现真正的故障规避，另一方面复盘的结果也应该作为一种数据资产在后续的稳定工作中产出更有实质性的帮助，比如丰富稳定性工作的方向和方式，再比如经验不足的研发可以从过去的故障中学习故障树FTA路径，以及恢复手段和关键决策。我们决定推翻标签限制的关注点生成架构，借鉴人工复盘思路，从五个域出发（架构，测试，编码，变更，应急），根据上下文先提出关键问题，再尝试回答。

2025-11-03 17:33:42 229

转载 AI Coding 长文分享：如何真正把工具用起来，从原理到实践

涵盖其底层机制（如Token计算、工具调用、Codebase索引与Merkle Tree）、提升对话质量的方法（如规则设置、渐进式开发）、实际应用场景（如代码检索、绘图生成、问题排查），并推荐了结合AI的编码最佳实践，包括文档、注释、命名规范和安全合规，旨在帮助不同经验水平的开发者真正把AI工具用好。我们不只可以粘代码、图片进去，还可以让模型参考网页、Git历史、当前打开的文件等，这些 IDE 类的工具支持的比较好，因为是在IDE环境里面，而CLI在终端中，限制就要多一些（但更灵活）。

2025-10-29 21:08:04 637

转载我的研发实践：高准确率AICoding工作流设计

在Agent框架选择上，一般我们在IDE或者cli中直接使用的都是单一Agent，单一LLMAgent可以通过工具、记忆、规划执行，很好的完成我们诸如：代码变更的诉求，如果我们的工作流有且仅有代码修改时，这样的架构无疑是最高效的，但是，我们也必须看到单一 Agent 有几个问题：工具太多可能导致选择复杂，上下文变得过于庞大，以及任务可能需要专业化。技术是帮助业务解决问题的手段，业务的形态，技术的使用是多样的，但是沉淀解决问题的能力，抽象解决问题的方法是不会变的。应该是，你想让这个方向变成未来的趋势吗？

2025-10-27 17:22:40 601

转载一次AI驱动的淘宝客户端需求开发实战

提供清晰和明确的prompt描述，在提供给AI Coding任务尽可能是你能预期输出，给出明确构建描述的任务，当你的Prompt不能指向一个明确的Coding 产物时，可能带来的就是无尽的再次沟通成本，带来的提效时长，在一次次反复补充信息中，逐渐消耗成0甚至不如我自己干了。尝试对收集中的问题，提供了一些解决的建议，截取如下。这样的开发方式，除了提升了Coding的效率，同时也能一定程度上降低客户端开发时，双端的不一致问题(逻辑差异，消息名不一致，技术方案差异等等)，减少了方案不一致导致后需问题的可能性。

2025-10-22 18:48:17 193

原创天猫行业中后台前端研发Agent设计

实践验证表明，这种策略带来了显著的投资回报：不仅实现了70%的代码查询延迟降低，系统的松耦合设计还确保了各组件的独立演进和优化能力。更严重的是API变更带来的认知偏差问题，已有工具的API可能已发生重大更新（如Tailwind CSS v4的breaking changes），模型对废弃方法和新增特性的把握存在准确性问题。无论是传统的VSCode、IntelliJ IDEA，还是新兴的AI增强型IDE如Cursor、Windsurf，它们的核心关注点依然停留在代码编写、调试和基础的智能提示层面。

2025-10-20 17:45:47 1607

转载初探：从0开始的AI-Agent开发踩坑实录

作为决策者：让 AI 做决策，意味着它需要对环境有深刻的理解，甚至具备一定程度的“常识”，在已知的模型能力下，往往和高质量的prompt和上下文强相关。我们的任务，就是在理解这些工具的边界和特性的基础上，遇到问题，分析问题，并用最恰当的方式去解决问题。面对这种不确定性，需要更精细的策略，例如Few-short，即好的例子，清晰的逻辑链条和工具使用指南，迭代式优化等等。在那个瞬间，我脑海里闪过的一个宏大的图景——一个全能的应用部署agent，好吧冷静下来，还是聚焦于一个小的开始，k8s部署物的自动生成。

2025-10-15 18:19:47 245

原创 AI 动画辅助实现的方案与实践

通过AI驱动的精准推荐、场景化表达与动态策略调控，我们为用户创造更自然、更智能的购物旅程，为营销业务提供高效、敏捷的技术支撑，助力淘宝构建以用户为中心的全域营销技术体系。这两个工具将非结构化的视觉动画转化为可编程、高性能、易维护的前端实现，显著降低了开发门槛，使原本耗时数小时的动画开发流程缩短至几分钟，实现了从设计到代码的高效落地。基于 AI 技术自动生成并优化 SVG 动画代码，尤其针对路径变形、形变动画等复杂场景，实现关键帧间的平滑过渡，输出轻量、可维护的动画代码，大幅降低开发门槛。

2025-10-13 18:10:00 1134

转载从Prompt到Context：为什么Think Tool是形式化的必然？

上面说的很多，其实重演了软件工程的历史，对可靠性、可验证性、可扩展性和可维护性的需求是完全相同的。这块的设计提升的效果非常的明显，在几个案例上都达到了明显的提效，甚至比R1的预先的思考更有效，这种玩法就是把思考这个行为从一种隐式的、不可观测的过程，转变为系统执行迹线中一个显式的、结构化的、可验证的动作。首先在这里说到的语言，并不是严格按照上面的谱系语言分级，也不是编程语言，这里指的是整个人类的自然语言，而这里的编译器指的是LLM，相当于是LLM来编译人类的语言产生结果，这之间自然是存在类似的形式化分级。

2025-10-09 16:57:36 157

原创产品经理也能“开发”需求？淘宝信息流从需求到上线的AI端到端实践

每个代码仓库相关的资料，存放在代码仓库特定路径下的markdown文件，在任务执行过程中可选择特定的上下文，由代码的所有开发者共同维护，同样可适用于Cursor或Jules等编程工具，包含目录结构、仓库工作流、技术栈等。有了强大的一个AI编码工具Codex，也有了需要执行的任务（提示词），我们如何指挥大模型进行正确的修改呢？团队在保证业务的同时，以先进的跨端框架和研发模式不断完善自己，打造最极致的体验和工程技术，保障多端设备的适配和稳定运行，并探索端智能等创新机会，通过技术高效驱动业务的良性发展。

2025-09-29 16:49:24 1094

原创一位淘宝工程同学的大模型LoRA微调尝试

通过AI驱动的精准推荐、场景化表达与动态策略调控，我们为用户创造更自然、更智能的购物旅程，为营销业务提供高效、敏捷的技术支撑，助力淘宝构建以用户为中心的全域营销技术体系。结果表明，LoRA 能以极低的计算成本让通用大模型有效学习业务知识，显著提升其在特定任务中的表现，真正实现“让大模型懂业务”，推动 AI 从“可用”走向“好用”。从智能客服到内容生成，从代码辅助到推荐系统，大模型正以前所未有的速度渗透到互联网技术的各个领域，成为驱动创新的核心引擎。），在不改变主干模型的前提下，仅通过训练少量新增参。

2025-09-24 16:35:52 607

转载 Claude Code 深度拆解：一个顶级AI编程工具的核心架构

整个Claude Code的核心资产，他这个cli效果这么好除了是因为强大的模型，也是因为有很强大的工具，例如有一个特别强大的bash tool的工具，可以调用shell里面的所有命令，也包含agent tool，可以发挥更强大的能力。际的使用过程中，Claude Code是一个比较通用的智能体，他输出的代码也比cursor简练很多，更像是一个熟悉整个项目的高级程序员，研究和学习这个框架对于开发自己的Agent至关重要，本篇文章会详细介绍Claude Code的设计模式和核心。

2025-09-22 16:47:38 596

原创多模态AI质检：身份核验场景实践

针对用户上传身份证时常见的图片问题，项目通过引入阿里云百炼平台的多模态模型，在OCR识别失败时进行智能检测与反馈，提供对客友好的提示文案，从而引导用户重新上传合格照片。上线后，相关指标表现出积极变化，OCR失败用户的再次失败率（OCR失败用户中再次识别仍失败的比例）有所下降，申请转化率有所提升。将“珠海”识别为“上海”。通过大模型提示词的增强优化，无需对每个场景进行大规模定制，用于多种类型的证件上传场景即可快速扩展功能，为更多业务场景赋能，未来结合工作流或智能体编排，将进一步提升可维护性和功能扩展能力。

2025-09-17 17:42:41 1021

转载基于智能体的自适应资损防控体系 - 淘工厂实践（二）

基于这些数据，Agent能够自动生成具体的监控建议，明确指出需要监控的具体对象、最佳监控时机、适用的监控类型，以及具体的监控值指标。正如我们在测试领域所践行的理念——"With great power comes great responsibility"，当我们拥有了AI这样强大的工具，更应该思考如何用它来创造更大的价值，守护每一分应得的收益，为业务的健康发展保驾护航。”的问题，新范式中，我们的Agent结合上文智能化提取到的知识，对用户输入的“小程序-下单积分玩法”需求文档，展开分析。

2025-09-12 17:40:37 529

原创 AI赋能前端开发提效实践：以长颈鹿接入为例

面对Weex/Muise架构限制、跨端兼容难题及分散的文档体系，作者转变传统开发模式，构建结构化、可被AI理解的研发知识库，并结合项目级编码规范与RAG技术，实现AI在组件开发、埋点集成、支付对接等环节的高效协同。但该项目积累的开发规范、组件模板与AI提示工程经验，在后续迁移至778红包项目时实现了高效复用，显著缩短了开发周期，提效成果得以充分释放。每天有较多用户在手淘搜索：天猫超市卡，经与搜索团队沟通，可在搜索长颈鹿场景下，直接透传猫超卡充赠组件，提升用户转化，给用户提供最直接的猫超卡充值服务。

2025-09-10 17:29:30 927

原创让你的大模型读懂二方包

另外理论上可以考虑直接把这个api的网页导出到markdown形式试一试，只不过我看了网页里面还嵌套了语雀文档，语雀文档中再去叙述出参里面代表了什么，而且网页里面的信息我看了一下和实际二方包也不符，比如要传入的订单id，网页中显示是long，实际二方包是传入的long[]，所以就放弃了。生成的代码质量和准确率飙升，连。近期有一个需求中需要查询用户订单状态，这个功能本身很简单，是一个经典的依赖下游场景，需要读取交易订单二方包的代码逻辑，并分析出入参出参的含义，并判定用户指定的订单是否已经进入终态。

2025-09-08 17:46:18 877

转载基于《架构现代化》浅谈架构共鸣

但其实，其厚度是不一样的。这样的认知下，架构应该是架构师，团队TL，领域专家大家一起共创和共识的结构，案例的输入既有上面的用户动线，业务策略比较偏问题域的部分，也有具体的实现案例，反射出问题域讨论未考虑到点。因为这样的过程，我们还是需要可以“沉淀的部分”，这是架构活动本身重复的抽象，是“架构”的“架构”。所以，当我们进入一个新的环境的时候，虽然看到的是系统复杂度，流程复杂度等一系列需要适应和学习的门槛，但是背后还是这个领域的“厚度”，其解决的问题需要涉及的相关方较多，概念的抽象和维护压力也很大。

2025-09-05 17:20:03 193

原创 AI审核工程实践：淘宝极有家破损包赔项目思考

有18笔人审单多次重试，也没有成功。AI智能人审能够结合自动化规则，并利用大模型的多模态、推理、概括等能力，识别用户上传的商品照片和订单信息是否相符，解析物流信息和聊天记录，综合判断佐证材料是否充分，最后给出保险理赔建议。27个FP分类结果中，6个和审核尺度相关，10个需要人工根据经验判断是质量原因还是物流原因，商品订单和照片不一致的6个案例中，有4个也可以理赔通过。剔除额度问题的审核单，理赔通过的概率有80%，因此不能以简单的准确率来衡量模型的效果，可以考虑模型标注可能破损的地方，提高人审效率和可信性。

2025-09-03 17:24:44 1172

转载 AI Agent工程化融合：分享我的实践经验和选型技巧

问题在于SSE的整个通讯过程都需要依赖SSE长链接，一旦出现网络毛刺（短暂中断），那么MCP Server向MCP Client发送的数据就会丢失，并且MCP Server无法感知到数据的丢失。举一个通俗的例子，把MCP Client 想象成DVD播放器，DVD播放器可以放入不同的碟片（MCP Server），不同的碟片有不同的内容（能力），但肯定不能向DVD播放器中放入磁带（不符合MCP的Server）。对于不同的报表场景，定时时间、具体的网页操作、要关注的指标、联系人等都各不相同。

2025-09-01 16:57:15 395

原创 HSF 序列化不可变集合类型问题原因分析

由于 hessian2 在序列化时仅序列化了 tag 字段，所以反序列化 java.util.CollSer 实例完成后，只有 tag 字段值为 1，表示 List，但是没有元素，即 array 字段为 null，由于 java.util.CollSer 实现了 readResolve 方法，在反序列化完成后会调用它，但是由于 array 字段为 null，所以抛出 InvalidObjectException 异常，反序列化失败。根据报错信息，原因是 HSF 不支持序列化/反序列化不可变集合类型。

2025-08-29 18:20:53 1329

原创分享一下我对好代码的理解

商业能力扩展、域扩展，在执行回收结果的时候，会遍历实现的插件，并结合回收规则，进行及时的熔断。于每一步棋来说，我们只能看到局部的影响（受限于我们能想到后面几步），当我们事后站在全局的角度看，有可能的“平平无奇”的一步却起着关键性的作用。闭原则，在面向对象编程领域中，规定“软件中的对象（类，模块，函数等等）应该对于扩展是开放的，但是对于修改是封闭的”，这意味着一个实体是允许在不改变它的。我们渐渐从单一的完成任务，开始思考如何更好地完成任务，从短期的设计开始考虑长期的感受，从单一的指标开始考虑更多的因素，

2025-08-27 17:37:03 889

原创深入聊聊RAG

日常我们会比较多的把RAG当成一个黑盒，输入是我们沉淀的文档，输出可能是整个AI应用反馈的最终结果（如下图所示），这样的方式下，我们可能可以收获一定的初期收益，但是当要持续优化或者扩展使用场景的时候，可能会缺乏评估和应对的方式，比较难去定位问题，因此也不太能说清楚当下链路的诉求，最后所对应的action也可能会偏离比较大。），中文的处理可以找相应的中文embedding模型，但是不是所有语言都有对应的编码模型，因为语种太多，同时如果一些语种对应的数据语料太少，不足以训练这样的一个模型。

2025-08-25 17:35:55 1203

空空如也

空空如也