看国内大厂如何在软件研发中玩转智能体（agents）？

最新推荐文章于 2025-11-30 18:24:05 发布

原创最新推荐文章于 2025-11-30 18:24:05 发布 · 649 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #大模型 #Agent

（本文结合了阿里巴巴、腾讯、百度、快手、华为、中兴、蚂蚁、字节等企业在智能体研发应用方面的最新实践，以及相关高校和研究机构的学术进展）

如果你问2025年软件研发领域什么最火，答案毫无疑问是智能体（Agent）。从曾经的代码补全小助手，到如今能独立完成复杂任务的"数字员工"，Agent正在改变着软件研发的每一个环节。

一、从Copilot到Agent：我们正在经历什么？

还记得GitHub Copilot刚出来时的惊艳吗？开发者们惊呼"这简直是结对编程的AI版本"。但如今，这种单纯的代码补全已经显得有些"初级"了。

在2025年的AiDD研发数字峰会上，来自阿里、腾讯、百度、快手等大厂的技术专家们不约而同地提到一个观点：我们正在从"Copilot时代"迈向"Coding Agent时代"，从被动的代码提示走向主动的任务完成。

这个变化有多大？打个比方：

Copilot时代：就像一个经验丰富的老师傅坐在你旁边，你写代码时他会说"这里可以这么写"，但主导权始终在你手上。
Coding Agent时代：更像是一个能独立工作的团队成员，你只需要告诉他"帮我实现一个用户登录模块"，他就能自己分析需求、设计方案、编写代码、跑测试，甚至发现问题后自己修复。

阿里巴巴的Qoder团队即将在AiDD峰会（深圳，11月14-15日）上分享的案例让人印象深刻：其IDE Agent已经能够"探索上下文工程的能力边界"——不仅理解当前代码，还能理解整个项目架构、业务逻辑、历史提交记录，甚至团队的编码风格。

二、Agent在软件研发全生命周期的"攻城略地"

1. 需求阶段：从文字游戏到知识图谱

传统的需求分析是个"玄学"——产品经理说的和开发理解的经常不是一回事。但现在，Agent正在改变这个局面。

中兴通讯将在AiDD峰会（深圳）上分享的"基于知识图谱的需求工程"实践非常有意思。他们用AI Agent做了这几件事：

多角色智能需求评审：让Agent模拟产品经理、开发、测试、运维等不同角色，从不同视角评审需求文档，提前发现遗漏和矛盾。
五维知识提效软件需求分析：通过业务知识、领域知识、产品知识、技术知识、历史知识五个维度，帮助需求分析师快速理解需求背景。

用他们产品负责人的话说："过去写一份需求文档要三天，现在用Agent辅助，半天就能完成初稿，而且质量还更高。"

2. 开发阶段：不只是写代码，更是理解代码

这是Agent发力最猛的领域。2025年，我们看到了几个重要趋势：

从IDE插件到独立IDE

极狐驭码的"Vibe Coding"理念提出了一个有趣的问题：为什么AI编程工具一定要寄生在传统IDE里？ 他们的CodeRider直接提供了一个为AI编程优化的全新开发环境，开发者可以用自然语言描述需求，Agent自动完成项目结构搭建、代码实现、依赖管理。

从单点优化到全链路协同

京东JoyCode IDE 2.0的实践将展示"生产级创新"的可能性：

Agent不仅能写新代码，还能读懂老代码（这对企业应用太重要了）
能在写代码的同时自动生成单元测试
甚至能做代码审查，指出潜在的性能问题和安全隐患

快手的经验更是让人眼前一亮：他们构建的"智效共生"体系，让AI Agent成为大型研发组织的"神经中枢"，不仅提升个人效率，更优化了整个团队的协作模式。

多端多模态：让Agent"看懂"UI

阿里巴巴的Mobile-Agent技术实践特别值得关注。传统的开发工具只能处理文本（代码），但Mobile-Agent能"看懂"移动端界面，直接通过截图理解UI结构，甚至能自动完成界面测试。这对移动应用开发来说是个巨大的效率提升。

3. 测试阶段：从被动验证到主动保障

测试领域的Agent化可能是最让测试工程师兴奋（或担忧？）的事情。

单元测试的自主生成

中兴通讯即将分享的"基于AI Agent与代码知识图谱的单元测试自主生成与自治优化实践"实践，实现了真正的"写完代码自动生成测试"。他们的Agent能：

分析代码逻辑，自动生成测试用例
发现测试覆盖率不足的地方，补充边界测试
测试失败时自动分析原因，甚至自己修复代码

接口测试的智能化

腾讯微信支付的接口测试Agent实践更加贴近业务场景。支付系统对稳定性要求极高，他们的Agent不仅能自动生成接口测试用例，还能模拟各种异常场景（网络延迟、并发冲击、数据异常等），大大提高了测试的覆盖度和有效性。

GUI测试的革命

蚂蚁集团的"多端多模态GUI智能体"解决了一个困扰业界多年的难题：跨平台UI测试自动化。他们的Agent能：

在Android、iOS、Web不同平台上自动识别UI元素
理解用户操作意图，自动生成测试脚本
当UI改版时，自动适配新的页面结构（这个太重要了！）

百度的前端测试实践则实现了"从用例生成与自愈、再到端到端智能化"的完整链路，测试用例能自己"进化"。

4. 运维阶段：AIOps的智能体革命

DevOps正在向AIOps演进，Agent在这里扮演着"智能运维工程师"的角色。

故障预测与诊断

去哪儿旅行的案例很有说服力：他们通过AI运维Agent实现了75%的提效。Agent能做什么？

实时监控系统指标，提前预警潜在故障
故障发生时自动定位根因（过去可能要几个小时，现在几分钟搞定）
自动执行修复操作（当然，关键操作还是需要人工审批）

华为在智算集群的实践更是要展示"大模型时代的新挑战"：训练大模型时GPU集群的故障诊断极其复杂，他们的Agent能够综合分析硬件指标、日志、网络拓扑等多维度信息，快速定位问题。

CI/CD的智能化

贝壳找房构建的"AI原生研发闭环"值得借鉴：

Agent自动分析代码变更影响范围，决定跑哪些测试
构建失败时自动分析日志，给出修复建议
甚至能优化CI/CD流水线本身的配置

小红书在可观测性方面的实践也将带给我们很大的启发：在AI业务驱动下，传统的监控指标已经不够用了，需要Agent来理解业务语义，提供更智能的观测能力。

5. 数据与知识管理：Agent的"大脑"

这是容易被忽视但极其重要的一环。

知识图谱：让Agent真正"懂"业务

华为的产品知识治理实践将会展示知识工程的价值：他们构建了覆盖产品、技术、流程的知识图谱，让Agent能够快速理解业务上下文。

南京柯基数据提出的"Agentic Knowledge Base"概念更进一步：不是简单地让Agent查询知识库，而是让知识库本身也"智能化"，能够根据Agent的使用情况自动组织、更新知识。

代码知识图谱：理解项目的"DNA"

OPPO在测试领域的实践很有意思：他们将通过代码知识图谱连接代码、测试用例、需求文档、bug记录，让Agent能够"看到"项目的全貌，而不仅仅是当前这一行代码。

三、多Agent协同：1+1>2的团队作战

2025年一个明显的趋势是：单个Agent的能力越来越强，但更重要的是多个Agent如何协同工作。

科大讯飞的多智能体协同实践

他们构建的"智能化驱动的研效提升新范式"很有代表性：

需求Agent负责理解和分析需求
开发Agent负责代码实现
测试Agent负责质量保障
部署Agent负责上线运维

这些Agent不是各干各的，而是通过共享知识图谱和消息机制协同工作。比如测试Agent发现bug，会自动通知开发Agent，并附上复现路径和可能的原因分析。

腾讯的跨平台Agent系统

腾讯PCG团队即将分享的"规格驱动·多端落地"方案解决了一个痛点：如何让Agent在不同平台（PC、移动端、Web）上协同工作？他们的答案是统一的规格描述语言，让不同平台的Agent能够"说同一种话"。

CAMEL-AI的愿景：Building the Future of Multi-agent Workforce

国际上的CAMEL-AI项目更是提出了"多智能体劳动力"的愿景：未来的软件团队可能是人类和多个专业化Agent的混合体，每个Agent都是特定领域的专家。

四、落地实践：大厂都在怎么玩？

从AiDD峰会议题可以看到，2025年的Agent应用已经从"概念验证"进入"规模化落地"阶段。

阿里系：从工具到生态

Qoder的布局很清晰：

IDE层：提供智能编码环境
CLI层：覆盖命令行场景（终端里的智能伙伴）
Plugin层：集成到JetBrains、VS Code等主流IDE
Cloud层：提供云端算力和模型服务

他们将专门举"Vibe Coding Mini黑客松"，鼓励开发者基于Qoder构建自己的AI编程工具。

腾讯系：深耕垂直场景

腾讯的策略是针对不同业务场景定制Agent：

微信支付场景的接口测试Agent
PCG（内容平台业务）的效能提升Agent
微信团队的大模型评测Agent

这种"一场景一Agent"的策略看起来"重"，但落地效果很实在。

字节系：数据驱动的效能提升

抖音团队的思路很"字节"：用数据说话，算清AI提效的"实在账"。他们不仅关注Agent能做什么，更关注：

省了多少时间？
减少了多少bug？
研发成本降低了百分之几？

这种务实的态度保证了Agent的应用不是"为了AI而AI"。

快手系：组织级的范式跃迁

快手提出的"大型研发组织的AI范式跃迁"很有高度。他们认为Agent不应该只是个人工具，而应该成为组织能力的一部分，从工具层、流程层、到文化层全面拥抱AI。

五、挑战与思考：Agent的"能"与"不能"

当然，Agent并非万能。从AiDD峰会的讨论中，我们将能看到一些现实的挑战：

1. 我们离"AI自主开发"还有多远？

主论坛的Panel讨论这个话题时，专家们的共识是：Agent在特定场景下已经能"自主开发"，但离完全自主还很远。

原因在于：

复杂业务逻辑的理解：仍然困难（尤其是那些没有明确文档的隐性规则）
多模块的协调：需要全局视角（单个Agent往往只能"看到"局部）
非功能性需求：（性能、安全、可维护性）的权衡需要经验

2. 上下文窗口：Agent的"记忆力"瓶颈

虽然大模型的上下文窗口越来越大（有的已经到200万tokens），但在实际应用中：

大项目的代码库轻松上亿字符
如何让Agent"记住"最相关的信息是个挑战

百度的"上下文工程和数据飞轮建设实践"、京东的"上下文工程"探索，都在尝试解决这个问题。

3. 可信度：AI生成的代码靠谱吗？

这是个绕不开的话题。峰会上有个专门的论坛叫"可信AI安全工程"，讨论：

如何验证AI生成代码的正确性？
如何防止AI引入安全漏洞？
如何保证AI不会泄露敏感信息？

中国人民大学、浙江大学、中科院的研究者们将分享最新的学术成果，但坦率说，这仍然是个开放问题。

4. 成本：算力不是免费的

大模型推理需要大量算力，尤其是复杂的Agent系统。如何在效果和成本之间找到平衡，是每个企业都要面对的现实问题。

阿里云、华为云、清程极智等厂商在AiDD峰会上即将分享的大模型训推优化、算力调度技术，就是在解决这个问题。

六、未来展望

从第8届AiDD峰会（深圳）所展示的Agent相关议题内容上来看，几个趋势已经很明确：

1. 从"编程助手"到"数字员工"

未来的Agent不会只停留在编程层面，而是会覆盖软件研发的全流程，成为真正的"数字员工"。你可以对它说："帮我完成这个需求，三天后上线"，它就会自己规划、执行、验证。

2. 从"通用Agent"到"专家Agent"

类似医生有不同科室，未来会有针对不同场景深度优化的专家Agent：

专攻前端开发的Agent
精通数据库优化的Agent
擅长安全审计的Agent

3. 从"工具"到"伙伴"

我在开场演讲中所提到的"从工具到伙伴"，点出了本质：Agent不是替代人，而是增强人的能力。就像当年从马车到汽车，改变的不只是交通工具，更是整个社会的运行方式。

4. 行业化、场景化

金融、汽车、政务等不同行业，对软件研发的需求差异巨大。在峰会上所看到的"数据智能及其行业应用"、"智能装备与机器人"等议题，预示着Agent会越来越行业化。

蔚来在整车智能化数据分析的探索、普元信息在政务AI的实践、新希望金融在大模型的应用，都是很好的例子。

写在最后：拥抱变化，但保持清醒

软件研发正在经历一场由Agent驱动的革命。这不是危言耸听，而是正在发生的现实。

但我们也要保持清醒：

Agent是工具，不是魔法

它能大幅提升效率，但替代不了人的创造力和判断力。

技术有边界，但可能性无限

今天Agent做不到的，明天可能就能做到。

变化是常态

与其担心被AI替代，不如学会与AI协作。

就像极狐驭码的杨波副总裁说的："AGENT驶入代码仓，我们正在经历的是企业研发效能的进化，而不是革命。进化意味着渐进、适应、共生。"

2025年，智能体在软件研发中的应用已经从"能不能用"进入了"怎么用好"的阶段。作为软件从业者，我们站在一个激动人心的时代路口：拥抱Agent，让它成为我们的"超级队友"，一起创造更好的软件、更高效的研发、更美好的数字世界。