「大模型驱动的Web UI测试脚本生成」进展

最新推荐文章于 2025-11-27 12:29:19 发布

原创最新推荐文章于 2025-11-27 12:29:19 发布 · 686 阅读

14 ·

CC 4.0 BY-SA版权

文章标签：

#前端 #ui #测试工具 #深度学习 #软件测试 #自动化测试 #职场经验

程序员同时被 3 个专栏收录

1659 篇文章

订阅专栏

软件测试

1641 篇文章

订阅专栏

自动化测试

981 篇文章

订阅专栏

📝 面试求职： 「面试试题小程序」，内容涵盖测试基础、Linux操作系统、MySQL数据库、Web功能测试、接口测试、APPium移动端测试、Python知识、Selenium自动化测试相关、性能测试、性能测试、计算机网络知识、Jmeter、HR面试，命中率杠杠的。（大家刷起来…）

📝 职场经验干货：

软件测试工程师简历上如何编写个人信息（一周8个面试）

软件测试工程师简历上如何编写专业技能（一周8个面试）

软件测试工程师简历上如何编写项目经验（一周8个面试）

软件测试工程师简历上如何编写个人荣誉（一周8个面试）

软件测试行情分享（这些都不了解就别贸然冲了.）

软件测试面试重点，搞清楚这些轻松拿到年薪30W+

软件测试面试刷题小程序免费使用（永久使用）

一、引言：大模型重塑Web UI自动化测试格局

Web UI自动化测试是保障软件质量的关键环节，然而传统Selenium脚本开发面临编写成本高、维护难度大、学习曲线陡峭等挑战。随着大语言模型(LLM)技术的成熟，2025年上半年，这一领域正经历革命性变革。

使用LLM生成Selenium脚本可将测试开发效率提升10-20倍，同时将维护成本降低70-80%。这种变革对测试工程师和教育工作者具有重大意义：测试团队能够将更多精力投入到测试设计而非代码编写上；教育工作者可以利用这些工具简化教学，使学生更专注于测试逻辑而非工具细节。

二、学术研究前沿：大模型生成测试脚本的技术突破

2.1 基于迭代混合程序分析的测试生成

2025年3月，Panta技术的提出代表了大模型在测试生成领域的重要突破。这项由Sijia Gu等人开发的技术通过模拟人类开发者分析代码和构建测试用例的迭代过程，显著提高了测试覆盖率。

Panta创新性地将静态控制流分析和动态代码覆盖分析相结合，系统地引导LLM识别未覆盖的执行路径并生成更好的测试用例。实验评估表明，在开源项目中具有高圈复杂度的类上，Panta比最先进的方法实现了26%更高的行覆盖率和23%更高的分支覆盖率。

2.2 自动化提示优化的测试用例生成

Prompt Alchemist是2025年初提出的一种针对测试用例生成的自动化提示优化技术，由Shuzheng Gao等人开发。该技术认识到LLM的性能高度依赖于提示的质量，而不同的LLM可能最适合不同的提示。

Prompt Alchemist的创新点在于：

它不是简单地组合和变异现有提示，而是基于适当的指导进行优化，避免了提示缺乏多样性和生成测试用例中重复错误的问题
它引入了领域上下文知识，增强了LLM在特定任务中的性能

2.3 基于LLM的测试生成与修复协同进化

TestART是2024年8月提出的一种新颖的单元测试生成方法，通过测试生成和修复的协同进化显著提升了LLM生成测试的质量。该方法首次利用基于模板的修复策略有效修复LLM生成测试用例中的错误，同时提取成功测试用例的覆盖信息作为覆盖率引导测试反馈。

在比较实验中，TestART在通过率上提高了18%，在三种数据集上的覆盖率提高了20%，并且仅用一半数量的测试用例就达到了比EvoSuite更好的覆盖率。

2.4 基于属性检索的测试生成增强

LLM-based Unit Test Generation via Property Retrieval是2024年10月提出的一种创新机制，它扩展了基于LLM的检索增强生成(RAG)技术，超越了基本的向量、文本相似性和基于图的方法。该方法考虑了任务特定的上下文，并引入了定制的属性检索机制。

在测试生成过程中，该方法将测试生成过程分为"Given"、"When"和"Thens"段落。当为目标方法生成测试时，它不仅检索被测代码的一般上下文，还考虑其他方法的现有测试等任务特定上下文，从而在目标方法和其他方法之间形成属性关系。

2.5 大模型在测试脚本生成中的挑战与局限

尽管LLM在测试脚本生成方面取得了显著进展，但仍存在一些重要挑战。2024年12月发表的研究指出，当前LLM-based测试生成工具在检测bug方面存在局限性。该研究使用真实的人为编写的错误代码作为输入，评估了这些工具如何未能检测到bug，甚至通过在生成的测试套件中验证bug并拒绝揭示bug的测试，使情况变得更糟。

研究表明，这些工具的测试预言设计为通过，这可能导致它们无法真正实现软件测试的预期目标。

三、产业应用进展：大模型在Web UI测试中的落地实践

AI驱动的Selenium测试自动化平台

2025年，多家企业推出了基于AI的Selenium测试自动化平台，这些平台利用大模型技术显著简化了Web UI测试脚本的生成过程。核心功能包括测试用例自动生成、自适应测试维护和多浏览器/跨平台支持。

自我修复的Selenium测试框架

Healenium（https://www.healenium.io/）是2025年推出的一种创新的AI驱动的UI测试自动化框架，特别针对解决Selenium测试脚本维护难题。该框架能够自动检测损坏的定位器并进行自我修复，无需手动更新。当UI发生变化导致定位器失败时，Healenium不会让测试失败，而是动态查找并修复定位器，减少手动维护工作。

基于大模型的Web UI测试脚本生成工具

2025年上半年，多家公司推出了专门针对Web UI测试脚本生成的大模型工具，这些工具能够直接生成可执行的Selenium脚本。如AI Test Case Generator、FREE AI-Powered Selenium Code Generator和AutonomIQ等工具，都能将自然语言描述的测试用例转换为可执行的Selenium脚本。