看国内大厂如何在软件研发中玩转智能体(agents)?

(本文结合了阿里巴巴、腾讯、百度、快手、华为、中兴、蚂蚁、字节等企业在智能体研发应用方面的最新实践,以及相关高校和研究机构的学术进展)

如果你问2025年软件研发领域什么最火,答案毫无疑问是智能体(Agent)。从曾经的代码补全小助手,到如今能独立完成复杂任务的"数字员工",Agent正在改变着软件研发的每一个环节。

一、从Copilot到Agent:我们正在经历什么?

还记得GitHub Copilot刚出来时的惊艳吗?开发者们惊呼"这简直是结对编程的AI版本"。但如今,这种单纯的代码补全已经显得有些"初级"了。

在2025年的AiDD研发数字峰会上,来自阿里、腾讯、百度、快手等大厂的技术专家们不约而同地提到一个观点:我们正在从"Copilot时代"迈向"Coding Agent时代",从被动的代码提示走向主动的任务完成。

这个变化有多大?打个比方:

  • Copilot时代:就像一个经验丰富的老师傅坐在你旁边,你写代码时他会说"这里可以这么写",但主导权始终在你手上。

  • Coding Agent时代:更像是一个能独立工作的团队成员,你只需要告诉他"帮我实现一个用户登录模块",他就能自己分析需求、设计方案、编写代码、跑测试,甚至发现问题后自己修复。

阿里巴巴的Qoder团队即将在AiDD峰会(深圳,11月14-15日)上分享的案例让人印象深刻:其IDE Agent已经能够"探索上下文工程的能力边界"——不仅理解当前代码,还能理解整个项目架构、业务逻辑、历史提交记录,甚至团队的编码风格。

二、Agent在软件研发全生命周期的"攻城略地"

1. 需求阶段:从文字游戏到知识图谱

传统的需求分析是个"玄学"——产品经理说的和开发理解的经常不是一回事。但现在,Agent正在改变这个局面。

中兴通讯将在AiDD峰会(深圳)上分享的"基于知识图谱的需求工程"实践非常有意思。他们用AI Agent做了这几件事:

  • 多角色智能需求评审:让Agent模拟产品经理、开发、测试、运维等不同角色,从不同视角评审需求文档,提前发现遗漏和矛盾。

  • 五维知识提效软件需求分析:通过业务知识、领域知识、产品知识、技术知识、历史知识五个维度,帮助需求分析师快速理解需求背景。

用他们产品负责人的话说:"过去写一份需求文档要三天,现在用Agent辅助,半天就能完成初稿,而且质量还更高。"

2. 开发阶段:不只是写代码,更是理解代码

这是Agent发力最猛的领域。2025年,我们看到了几个重要趋势:

从IDE插件到独立IDE

极狐驭码的"Vibe Coding"理念提出了一个有趣的问题:为什么AI编程工具一定要寄生在传统IDE里? 他们的CodeRider直接提供了一个为AI编程优化的全新开发环境,开发者可以用自然语言描述需求,Agent自动完成项目结构搭建、代码实现、依赖管理。

从单点优化到全链路协同

京东JoyCode IDE 2.0的实践将展示"生产级创新"的可能性:

  • Agent不仅能写新代码,还能读懂老代码(这对企业应用太重要了)

  • 能在写代码的同时自动生成单元测试

  • 甚至能做代码审查,指出潜在的性能问题和安全隐患

快手的经验更是让人眼前一亮:他们构建的"智效共生"体系,让AI Agent成为大型研发组织的"神经中枢",不仅提升个人效率,更优化了整个团队的协作模式。

多端多模态:让Agent"看懂"UI

阿里巴巴的Mobile-Agent技术实践特别值得关注。传统的开发工具只能处理文本(代码),但Mobile-Agent能"看懂"移动端界面,直接通过截图理解UI结构,甚至能自动完成界面测试。这对移动应用开发来说是个巨大的效率提升。

3. 测试阶段:从被动验证到主动保障

测试领域的Agent化可能是最让测试工程师兴奋(或担忧?)的事情。

单元测试的自主生成

中兴通讯即将分享的"基于AI Agent与代码知识图谱的单元测试自主生成与自治优化实践"实践,实现了真正的"写完代码自动生成测试"。他们的Agent能:

  • 分析代码逻辑,自动生成测试用例

  • 发现测试覆盖率不足的地方,补充边界测试

  • 测试失败时自动分析原因,甚至自己修复代码

接口测试的智能化

腾讯微信支付的接口测试Agent实践更加贴近业务场景。支付系统对稳定性要求极高,他们的Agent不仅能自动生成接口测试用例,还能模拟各种异常场景(网络延迟、并发冲击、数据异常等),大大提高了测试的覆盖度和有效性。

GUI测试的革命

蚂蚁集团的"多端多模态GUI智能体"解决了一个困扰业界多年的难题:跨平台UI测试自动化。他们的Agent能:

  • 在Android、iOS、Web不同平台上自动识别UI元素

  • 理解用户操作意图,自动生成测试脚本

  • 当UI改版时,自动适配新的页面结构(这个太重要了!)

百度的前端测试实践则实现了"从用例生成与自愈、再到端到端智能化"的完整链路,测试用例能自己"进化"。

4. 运维阶段:AIOps的智能体革命

DevOps正在向AIOps演进,Agent在这里扮演着"智能运维工程师"的角色。

故障预测与诊断

去哪儿旅行的案例很有说服力:他们通过AI运维Agent实现了75%的提效。Agent能做什么?

  • 实时监控系统指标,提前预警潜在故障

  • 故障发生时自动定位根因(过去可能要几个小时,现在几分钟搞定)

  • 自动执行修复操作(当然,关键操作还是需要人工审批)

华为在智算集群的实践更是要展示"大模型时代的新挑战":训练大模型时GPU集群的故障诊断极其复杂,他们的Agent能够综合分析硬件指标、日志、网络拓扑等多维度信息,快速定位问题。

CI/CD的智能化

贝壳找房构建的"AI原生研发闭环"值得借鉴:

  • Agent自动分析代码变更影响范围,决定跑哪些测试

  • 构建失败时自动分析日志,给出修复建议

  • 甚至能优化CI/CD流水线本身的配置

小红书在可观测性方面的实践也将带给我们很大的启发:在AI业务驱动下,传统的监控指标已经不够用了,需要Agent来理解业务语义,提供更智能的观测能力。

5. 数据与知识管理:Agent的"大脑"

这是容易被忽视但极其重要的一环。

知识图谱:让Agent真正"懂"业务

华为的产品知识治理实践将会展示知识工程的价值:他们构建了覆盖产品、技术、流程的知识图谱,让Agent能够快速理解业务上下文。

南京柯基数据提出的"Agentic Knowledge Base"概念更进一步:不是简单地让Agent查询知识库,而是让知识库本身也"智能化",能够根据Agent的使用情况自动组织、更新知识。

代码知识图谱:理解项目的"DNA"

OPPO在测试领域的实践很有意思:他们将通过代码知识图谱连接代码、测试用例、需求文档、bug记录,让Agent能够"看到"项目的全貌,而不仅仅是当前这一行代码。

三、多Agent协同:1+1>2的团队作战

2025年一个明显的趋势是:单个Agent的能力越来越强,但更重要的是多个Agent如何协同工作

科大讯飞的多智能体协同实践

他们构建的"智能化驱动的研效提升新范式"很有代表性:

  • 需求Agent负责理解和分析需求

  • 开发Agent负责代码实现

  • 测试Agent负责质量保障

  • 部署Agent负责上线运维

这些Agent不是各干各的,而是通过共享知识图谱消息机制协同工作。比如测试Agent发现bug,会自动通知开发Agent,并附上复现路径和可能的原因分析。

腾讯的跨平台Agent系统

腾讯PCG团队即将分享的"规格驱动·多端落地"方案解决了一个痛点:如何让Agent在不同平台(PC、移动端、Web)上协同工作?他们的答案是统一的规格描述语言,让不同平台的Agent能够"说同一种话"。

CAMEL-AI的愿景:Building the Future of Multi-agent Workforce

国际上的CAMEL-AI项目更是提出了"多智能体劳动力"的愿景:未来的软件团队可能是人类和多个专业化Agent的混合体,每个Agent都是特定领域的专家。

四、落地实践:大厂都在怎么玩?

从AiDD峰会议题可以看到,2025年的Agent应用已经从"概念验证"进入"规模化落地"阶段。

阿里系:从工具到生态

Qoder的布局很清晰:

  • IDE层:提供智能编码环境
  • CLI层:覆盖命令行场景(终端里的智能伙伴)
  • Plugin层:集成到JetBrains、VS Code等主流IDE
  • Cloud层:提供云端算力和模型服务

他们将专门举"Vibe Coding Mini黑客松",鼓励开发者基于Qoder构建自己的AI编程工具。

腾讯系:深耕垂直场景

腾讯的策略是针对不同业务场景定制Agent

  • 微信支付场景的接口测试Agent

  • PCG(内容平台业务)的效能提升Agent

  • 微信团队的大模型评测Agent

这种"一场景一Agent"的策略看起来"重",但落地效果很实在。

字节系:数据驱动的效能提升

抖音团队的思路很"字节":用数据说话,算清AI提效的"实在账"。他们不仅关注Agent能做什么,更关注:

  • 省了多少时间?

  • 减少了多少bug?

  • 研发成本降低了百分之几?

这种务实的态度保证了Agent的应用不是"为了AI而AI"。

快手系:组织级的范式跃迁

快手提出的"大型研发组织的AI范式跃迁"很有高度。他们认为Agent不应该只是个人工具,而应该成为组织能力的一部分,从工具层、流程层、到文化层全面拥抱AI。

五、挑战与思考:Agent的"能"与"不能"

当然,Agent并非万能。从AiDD峰会的讨论中,我们将能看到一些现实的挑战:

1. 我们离"AI自主开发"还有多远?

主论坛的Panel讨论这个话题时,专家们的共识是:Agent在特定场景下已经能"自主开发",但离完全自主还很远

原因在于:

  • 复杂业务逻辑的理解:仍然困难(尤其是那些没有明确文档的隐性规则)
  • 多模块的协调:需要全局视角(单个Agent往往只能"看到"局部)
  • 非功能性需求:(性能、安全、可维护性)的权衡需要经验

2. 上下文窗口:Agent的"记忆力"瓶颈

虽然大模型的上下文窗口越来越大(有的已经到200万tokens),但在实际应用中:

  • 大项目的代码库轻松上亿字符

  • 如何让Agent"记住"最相关的信息是个挑战

百度的"上下文工程和数据飞轮建设实践"、京东的"上下文工程"探索,都在尝试解决这个问题。

3. 可信度:AI生成的代码靠谱吗?

这是个绕不开的话题。峰会上有个专门的论坛叫"可信AI安全工程",讨论:

  • 如何验证AI生成代码的正确性?

  • 如何防止AI引入安全漏洞?

  • 如何保证AI不会泄露敏感信息?

中国人民大学、浙江大学、中科院的研究者们将分享最新的学术成果,但坦率说,这仍然是个开放问题

4. 成本:算力不是免费的

大模型推理需要大量算力,尤其是复杂的Agent系统。如何在效果和成本之间找到平衡,是每个企业都要面对的现实问题。

阿里云、华为云、清程极智等厂商在AiDD峰会上即将分享的大模型训推优化、算力调度技术,就是在解决这个问题。

六、未来展望

从第8届AiDD峰会(深圳)所展示的Agent相关议题内容上来看,几个趋势已经很明确:

1. 从"编程助手"到"数字员工"

未来的Agent不会只停留在编程层面,而是会覆盖软件研发的全流程,成为真正的"数字员工"。你可以对它说:"帮我完成这个需求,三天后上线",它就会自己规划、执行、验证。

2. 从"通用Agent"到"专家Agent"

类似医生有不同科室,未来会有针对不同场景深度优化的专家Agent

  • 专攻前端开发的Agent

  • 精通数据库优化的Agent

  • 擅长安全审计的Agent

3. 从"工具"到"伙伴"

我在开场演讲中所提到的"从工具到伙伴",点出了本质:Agent不是替代人,而是增强人的能力。就像当年从马车到汽车,改变的不只是交通工具,更是整个社会的运行方式。

4. 行业化、场景化

金融、汽车、政务等不同行业,对软件研发的需求差异巨大。在峰会上所看到的"数据智能及其行业应用""智能装备与机器人"等议题,预示着Agent会越来越行业化。

蔚来在整车智能化数据分析的探索、普元信息在政务AI的实践、新希望金融在大模型的应用,都是很好的例子。

写在最后:拥抱变化,但保持清醒

软件研发正在经历一场由Agent驱动的革命。这不是危言耸听,而是正在发生的现实。

但我们也要保持清醒:

  • Agent是工具,不是魔法

它能大幅提升效率,但替代不了人的创造力和判断力。

  • 技术有边界,但可能性无限

今天Agent做不到的,明天可能就能做到。

  • 变化是常态

与其担心被AI替代,不如学会与AI协作。

就像极狐驭码的杨波副总裁说的:"AGENT驶入代码仓,我们正在经历的是企业研发效能的进化,而不是革命。进化意味着渐进、适应、共生。"

2025年,智能体在软件研发中的应用已经从"能不能用"进入了"怎么用好"的阶段。作为软件从业者,我们站在一个激动人心的时代路口:拥抱Agent,让它成为我们的"超级队友",一起创造更好的软件、更高效的研发、更美好的数字世界。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值