cuda7parallel
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
33、基于DRL的QoE感知SFC编排训练质量测试
本文研究了基于深度强化学习(DRL)的服务功能链(SFC)编排方法,旨在在满足服务质量(QoS)的同时最大化用户体验质量(QoE)。通过采用Double DQN算法,有效解决了传统DQN中的Q值高估问题,提升了策略的稳定性和收敛性能。文章详细阐述了DRL智能体的设计、训练与在线评估机制,并通过数值实验验证了该方法在不同网络规模下的优越性能和鲁棒性。结果表明,相较于传统方法,基于Double DQN的SFC编排方案在QoE提升、收敛速度和适应动态环境方面具有显著优势。未来工作将聚焦于奖励函数优化及在多域与异构原创 2025-10-04 01:59:58 · 22 阅读 · 0 评论 -
32、GResilience:协作式人工智能系统绿色性与恢复力的权衡
本文提出GResilience方法,旨在解决协作式人工智能系统(CAIS)中绿色性与恢复力之间的权衡问题。通过优化模型和博弈论两种技术,自动化评估恢复行动,实现能源效率与系统弹性的平衡。研究以CORAL机器人系统为演示器,设计实验验证方法有效性,并规划未来引入强化学习、扩展非功能属性测试及考虑人类能量与财务成本等方向,推动CAIS向更智能、可持续的方向发展。原创 2025-10-03 13:40:17 · 26 阅读 · 0 评论 -
31、CATANA:以太坊区块链的重放测试
本文介绍了一种利用历史区块链交易对可升级以太坊智能合约进行重放测试的方法,并提出了工具CATANA的实现与评估。通过代理合约机制,CATANA在分叉的以太坊网络上重放历史交易,验证升级前后合约行为的一致性。实验结果表明,该方法能有效检测升级引入的不一致问题,在Compound、USDC等真实项目中成功识别出潜在破坏性变更。文章还探讨了当前局限性及未来改进方向,包括事件日志检查、缺失交易重放和高效交易选择策略,为智能合约的质量保障提供了有力支持。原创 2025-10-02 10:23:44 · 48 阅读 · 0 评论 -
30、组合测试在大语言模型测试及以太坊区块链重放测试中的应用
本文探讨了组合测试在大语言模型(LLM)测试中的应用,以及以太坊区块链中智能合约的重放测试方法。通过构建输入参数模型(IPM)和生成t-路组合测试集,实现了对LLM语义一致性与响应稳定性的系统评估,并结合BoolQ数据集对T5和LLaMa模型进行了实验分析。同时,针对以太坊智能合约升级难题,提出基于代理模式的重放测试方案,利用公共交易历史生成测试脚本,验证新版本合约的兼容性与可靠性。研究展示了两种测试方法在AI与区块链领域的重要价值,并展望了未来优化方向。原创 2025-10-01 14:39:31 · 12 阅读 · 0 评论 -
29、概率检查序列最小化与组合测试在不同领域的应用
本文探讨了概率检查序列最小化和组合测试在不同技术领域中的应用。概率检查序列最小化通过去除初始状态假设并利用同步序列缩短测试长度,在保证测试质量的同时降低测试成本、提高效率,适用于非初始化有限状态机的验证。组合测试则应用于大语言模型(LLM)测试中,通过构建输入参数模型和生成t-路组合测试集,实现测试数据的多样化与高覆盖率,并支持自动化测试流程。文章还总结了两种方法的优势、面临的挑战及未来发展方向,指出其在系统测试与验证中的重要价值和潜力。原创 2025-09-30 16:11:59 · 61 阅读 · 0 评论 -
28、基于马尔可夫链和概率方法的测试用例优先级排序与检查序列最小化
本文探讨了基于马尔可夫链和概率方法在软件测试中的应用,重点分析了测试用例优先级排序与非确定性有限状态机(FSM)的检查序列最小化。通过离散时间马尔可夫链(DTMC)模型结合H1和H2两种启发式方法生成测试序列,实现了高覆盖率和有效序列筛选。同时,研究了非确定性FSM下基于概率的检查序列最小化策略,提出了P-可能分离序列等概念以提升测试效率。文章总结了该方法的优势与挑战,并展望了未来在比较分析、可扩展性和可靠性评估方面的研究方向。原创 2025-09-29 12:11:18 · 42 阅读 · 0 评论 -
27、使用马尔可夫链对测试用例进行优先级排序
本文介绍了一种基于马尔可夫链的测试用例优先级排序方法,利用转移概率和稳态概率对测试序列进行排序,以提高测试效率和质量。通过三个不同领域的案例研究(自动取款机、机器人GUI、安全家庭系统),验证了该方法在不同场景下的可行性和有效性。实验结果表明,基于H1(弧概率)和H2(状态概率)两种启发式策略生成的高优先级测试序列具有较高交集,且能有效覆盖独立路径,同时显著减少需执行的测试用例数量。结合多项评估指标(如效率、覆盖率、有用性等),展示了该方法在资源受限情况下的优越性能。原创 2025-09-28 09:06:26 · 52 阅读 · 0 评论 -
26、基于模型的测试组合性与马尔可夫链测试用例优先级排序
本文探讨了基于模型的测试中的组件组合性与马尔可夫链在测试用例优先级排序中的应用。在测试组合性方面,研究了组件间的相互接受关系及其对大型系统多组件组合的适用性,并提出了未来在算法优化、多组件推断和数据扩展方面的研究方向。在测试用例优先级排序方面,提出基于转移概率(H1)和稳态概率(H2)的两种启发式方法,实验显示两者均实现100%覆盖率,H2效率达99.4%,优于H1。结合实例分析与流程图,展示了理论模型的实际应用潜力,为提升软件测试效率与可靠性提供了新思路。原创 2025-09-27 15:21:44 · 56 阅读 · 0 评论 -
25、基于模型测试中的组合性探究
本文探讨了基于模型测试中的组合性问题,通过引入‘相互接受’概念和相关定理,解决了组件单独符合规范但在组合后出现未指定行为的问题。以汽车自动停车系统为例,展示了如何利用Utraces和uioco关系发现集成缺陷,并通过扩展规范预防问题。文章进一步分析了组件替换与系统诊断中的应用,表明该方法可在开发早期识别问题,提升测试效率与系统可靠性。同时对比了接口自动机和eco等现有工作,突出了本方法在保持模型简洁性和实践适用性方面的优势。原创 2025-09-26 14:19:18 · 20 阅读 · 0 评论 -
24、基于学习的模块测试与模型组合性测试策略
本文介绍了两种先进的软件测试策略:基于学习的白盒模块测试策略和模型组合性测试策略。前者通过输入/输出抽象、模糊测试加速、高效学习算法和违规检测,有效验证被测实现是否满足线性时态逻辑(LTL)属性,并在实验中展现出良好性能;后者针对传统基于模型测试(MBT)缺乏组合性的问题,引入互接受关系,确保组件在组合后仍保持正确通信与一致性,显著提升系统可测试性与可维护性。文章还探讨了该策略在组件替换和系统诊断中的优势,并与现有工作进行了比较,最后提出了未来研究方向,包括支持非确定性系统、并行化优化及工具资格认证等。原创 2025-09-25 12:28:12 · 59 阅读 · 0 评论 -
23、面向属性的模块测试全解析
本文深入解析了面向属性的模块测试方法,结合白盒知识、模糊测试与学习算法,提出了一种高效检测软件模块属性违反的策略。通过构建符号有限状态机(SFSM)的输入/输出等价类,利用L#算法和H方法优化学习与一致性测试过程,并借助模糊测试加速状态探索。实验以汽车防抱死制动系统(ABS)为案例,验证了该方法在不同LTL属性下的有效性与性能优势,展示了其在减少运行时间、避免内存耗尽方面的潜力。文章还探讨了实际应用中的关键参数调优及未来发展方向。原创 2025-09-24 13:37:36 · 47 阅读 · 0 评论 -
22、软件测试方法:Markov链与属性导向模块测试
本文介绍了两种高效的软件测试方法:基于Markov链的测试用例优先级排序和完整的属性导向模块测试。前者通过概率模型提升测试效率,后者结合模型学习、模型检查与一致性测试,能够验证软件模块是否满足线性时态逻辑(LTL)属性,尤其适用于输入输出域无限的复杂系统。文章详细阐述了黑盒检查算法流程、关键改进措施(如符号有限状态机支持、H-方法、覆盖引导模糊测试),并通过性能对比展示了其优势。同时介绍了开源库libsfsmtest和云接口对方法的应用支持,最后展望了未来在更复杂属性、自适应策略及集成测试体系中的发展方向。原创 2025-09-23 13:25:18 · 50 阅读 · 0 评论 -
21、软件开发中的测试异味与测试用例优先级研究
本文探讨了软件开发中的测试异味评估与基于马尔可夫链的测试用例优先级排序方法。研究分析了常见测试异味如Lazy Test、Eager Test等的开发者处理共识,并指出了当前检测规则、移除原因识别和映射算法的有效性威胁。同时,通过系统文献综述,总结了马尔可夫链在测试用例优先级中的六种应用方式,并提出了实际应用中的三大挑战及解决方案。文章还展望了未来研究方向,包括优化模型、结合机器学习以及加强实际验证,旨在提升软件测试效率与质量。原创 2025-09-22 15:16:19 · 54 阅读 · 0 评论 -
20、从开发者行为评估技术债务
本文通过分析12个GitHub开源项目中开发者对测试代码异味的处理行为,采用平均移除时间(MTTR)作为评估技术债务的关键指标,研究了19种测试异味的引入与清除模式。根据异味的平均引入次数和移除速度,将其分为代表性不足、快速移除、中等移除和缓慢移除四类,并结合项目生命周期进行归一化分析。研究发现,如Mystery Guest等异味被迅速修复,而Assertion Roulette和Magic Number Test等则长期存在,反映出开发者对其技术债务认知较低。文章还讨论了当前检测规则的局限性,并提出了改进原创 2025-09-21 12:07:44 · 18 阅读 · 0 评论 -
19、软件测试中的问题解决与测试异味评估
本文探讨了软件测试中的问题解决与测试异味评估两大核心议题。在问题解决方面,提出一个基于认知过程的扩展模型,强调测试人员内部表征对测试活动选择的影响,并指出调查方法的局限性。在测试异味评估方面,通过对12个开源项目中19种测试异味的实证分析,发现仅有部分异味被开发人员认为是需要消除的技术债务,揭示当前研究与实际开发关注点存在脱节。研究为改进测试实践、优化异味管理策略及提升软件质量提供了重要启示。原创 2025-09-20 15:41:44 · 44 阅读 · 0 评论 -
18、软件测试中的问题解决:全面解析与实践指南
本文深入探讨了软件测试中的问题解决过程,采用主题分析方法识别测试人员在理解目标、规划策略、执行用例和检查结果等阶段的行为模式、知识来源及挑战。基于调查结果,提出一个扩展的问题解决模型,涵盖从目标识别到结果评估的全流程,并结合安全测试实例详细解析各阶段实践。文章还强调测试过程的灵活性与测试人员所需的技术、分析、沟通和学习能力,最后从知识管理、工具使用、团队协作和人才培养四个方面提出优化建议,旨在提升软件测试效率与质量。原创 2025-09-19 16:31:20 · 60 阅读 · 0 评论 -
17、软件测试中的安全需求形式化与问题解决探索
本文探讨了软件测试中的安全需求形式化方法RQCODE及其在安全测试中的应用优势,对比了BDD和SQUARE等其他方法的特点。同时,基于对38名瑞典软件开发人员和测试人员的调查,深入分析了测试过程中人类的认知行为与问题解决机制,构建并深化了一个包含理解目标、规划策略、执行测试和检查结果的四阶段认知模型。研究还揭示了各测试阶段的活动、知识需求与挑战,并提出了测试停止标准。该认知模型对提升测试效率、指导自动化工具开发及促进团队协作具有重要价值。原创 2025-09-18 15:32:32 · 62 阅读 · 0 评论 -
16、软件安全测试与RQCODE方法解析
本文深入探讨了软件安全测试的重要性及其主要方法与局限性,介绍了SQUARE方法论和行为驱动设计(BDD)在安全需求定义中的应用。重点解析了ReQuirements as CODE(RQCODE)方法,通过将安全需求以代码形式表达,实现需求与测试的紧密结合,提升可追溯性、可重用性和自动化验证能力。结合Windows 10 STIG案例,展示了RQCODE在实际安全合规中的应用优势,并对比分析了其与传统安全测试的差异。最后提出结合使用建议与未来发展方向,为提升软件系统安全性提供了创新路径。原创 2025-09-17 11:15:40 · 43 阅读 · 0 评论 -
15、多设备、健壮且集成的 Android GUI 测试与安全需求形式化测试
本文探讨了多设备、健壮且集成的Android GUI测试框架与安全需求形式化测试方法RQCODE。针对Android GUI测试中存在的硬件碎片化、测试脆弱性及维护成本高等问题,提出涵盖测试执行、覆盖率测量、脆弱性跟踪与自动修复的综合框架,并分析了现有工具的覆盖情况与研究空白。同时,介绍RQCODE方法如何通过将安全需求代码化实现自动化测试与持续验证,提升软件安全性。文章还为测试人员、工具开发者和研究人员提供了行动建议,并展望了未来在自动修复工具、优先级模型优化及方法实践应用方面的研究方向。原创 2025-09-16 15:30:19 · 47 阅读 · 0 评论 -
14、软件测试:从目标到框架的全面解析
本文全面解析了软件测试从测试目标到测试框架设计的各个环节。重点探讨了测试目标对测试用例设计的影响,分析了安卓GUI测试面临的碎片化、脆弱性、不稳定性及可推广性等挑战,并提出了GEM测试框架,涵盖测试生成、执行与维护三大模块。通过流程图展示了测试用例的手动编写、捕获与回放、AI辅助生成及变体管理,强调了测试维护中预测、修复与优先级排序的重要性。最后展望了多目标测试设计、自动化生成优化和跨平台测试框架的发展方向,为提升软件测试效率与质量提供了系统性思路。原创 2025-09-15 16:59:28 · 42 阅读 · 0 评论 -
13、不同类型的测试目标如何影响测试用例设计
本文探讨了不同类型的测试目标如何影响测试用例的设计,涵盖了正确性、可靠性、性能、质量、安全性等九种目标类型。通过访谈与调查数据,分析了各目标的重要性排序及其对测试用例数量和设计流程的定量影响。文章详细阐述了针对不同目标的测试设计流程、常用模式、适用的测试实践与工具,并讨论了系统类型和组织因素的作用。最后提出了应对各类测试目标的策略建议,强调测试人员需根据具体目标灵活调整设计方法,以提升测试效率与软件质量。原创 2025-09-14 14:14:44 · 41 阅读 · 0 评论 -
12、不同类型的测试目标如何影响测试用例设计?
本文探讨了不同类型的测试目标如何影响测试用例的设计。通过半结构化访谈和调查,研究识别出九种主要测试目标,并评估了它们的相对重要性。研究发现,正确性、可靠性和质量是最重要的目标,其中正确性测试构成了默认设计模式的基础。不同目标对应不同的测试实践和工具,且测试设计受到组织流程和团队结构的影响。该研究为优化测试设计过程提供了理论基础和实践指导。原创 2025-09-13 11:14:19 · 50 阅读 · 0 评论 -
11、TQED:一种创新的测试设计启发式技术
TQED是一种创新的测试设计启发式技术,通过数据(D)、事件(E)、数量(Q)和时间(T)四个基本维度构建模型,平衡了测试方法的通用性与具体性。该方法有助于激发测试人员创造力,提升缺陷检测能力。博文详细介绍了TQED的理论基础、使用步骤、与其他方法的比较,并通过实验验证其在变异覆盖率和失败率上的优势,最后提出了应用建议与未来研究方向。原创 2025-09-12 16:39:07 · 58 阅读 · 0 评论 -
10、自动化测试与TQED测试设计启发式技术
本文探讨了自动化测试系统在多平台环境下的应用,以充电点管理系统为例,展示了通过Gherkin和桥接模式实现无需编程知识的端到端测试自动化,显著提升测试效率。同时介绍TQED测试设计启发式模型,通过时间、数量、事件、数据四个维度激发测试创造力,并通过控制实验证明其在提高代码覆盖率、突变覆盖率和缺陷发现能力方面的有效性。研究表明,TQED模型能显著增强测试用例的质量与测试过程的创造性,未来可进一步扩展其在自动化测试中的集成应用。原创 2025-09-11 11:10:32 · 33 阅读 · 0 评论 -
9、测试自动化技术:从单一应用到系统集成
本文探讨了两种先进的测试自动化技术:Seeding Contradiction(SC)和跨平台系统集成测试。SC方法能高效生成全覆盖测试用例,在多种程序上表现优于IntelliTest和AutoTest,但受限于非线性计算处理能力和Eiffel系统支持;跨平台测试方法结合Cucumber、Selenium和Appium,采用BDD原则实现Web与移动应用的统一测试,显著提升测试效率与问题发现率。文章还分析了两种技术的优势、局限性及未来发展方向,包括SC的求解器增强、泛型支持,以及跨平台测试向多设备、智能化演原创 2025-09-10 09:33:04 · 60 阅读 · 0 评论 -
8、播种矛盾:快速生成全覆盖测试套件
本文介绍了一种名为‘播种矛盾’(Seeding Contradiction, SC)的测试套件生成策略,旨在快速实现程序的穷举覆盖。通过在程序中插入不正确的检查指令,利用证明器的反例生成能力,SC 能高效生成高覆盖率的测试用例。实验表明,SC 在20个程序上均实现了接近或达到100%的分支覆盖率,平均耗时不足0.5秒,远快于 IntelliTest 和 AutoTest,且生成的测试套件最小。文章详细分析了 SC 的正确性、实现机制、性能优势,并探讨了其在快速开发、复杂程序测试和长期维护中的应用场景及局限性原创 2025-09-09 10:13:52 · 43 阅读 · 0 评论 -
7、图像修改测试与全覆盖测试套件生成方法解析
本文探讨了两种高效的测试方法:一是针对计算机视觉应用的图像修改测试,比较了程序化与手动图像修改的差异,验证了其在肋条检查工具中的有效性;二是提出了一种名为“Seeding Contradiction”的全自动高覆盖率测试套件生成方法,通过在基本块中插入条件错误指令并利用SMT证明器生成反例,实现100%分支覆盖率。该方法具有静态、快速、无需执行代码等优势,并通过实例和对比分析展示了其优越性。最后展望了两种方法在更多语言、程序类型及图像处理参数上的扩展潜力。原创 2025-09-08 14:42:53 · 45 阅读 · 0 评论 -
6、基于图像修改的光度立体应用测试评估
本文评估了基于图像修改的光度立体应用在肋条表面质量检测中的测试效果,重点比较了手动旋转与图像修改框架旋转对检测结果的影响。通过不同背景填充和子图像选取的实验设置,分析了相对误差及其成因,验证了图像修改方法在反映旋转影响方面的有效性与局限性。研究结果表明,在优化实验条件下,该方法具备合理精度,可为计算机视觉系统的鲁棒性测试提供有效支持。原创 2025-09-07 10:05:04 · 47 阅读 · 0 评论 -
5、用于测试数据生成的领域特定语言(DSL):创新与实践
本文介绍了一种基于语言模型的领域特定语言(DSL)设计方法,用于解决软件测试中缺乏高质量生产级测试数据的问题。通过在挪威人口登记(NPR)领域的应用,设计出表现力更强、约束更复杂的Steveflex语言,并与早期的Steve132进行对比,验证了其在数据质量上的优势。尽管计算成本有所增加,但仍在可接受范围内。该方法可推广至其他领域,支持高效生成符合业务规则的合成数据,适用于测试、数据分析和机器学习等场景,具有广泛的应用潜力和优化前景。原创 2025-09-06 15:08:35 · 33 阅读 · 0 评论 -
4、测试数据生成的领域特定语言:Steve132与Steveflex对比
本文对比了两种用于测试数据生成的领域特定语言Steve132与Steveflex,重点分析了它们在语言结构、信息容量、表达能力及生成数据质量方面的差异。Steveflex通过引入结构令牌和元数据,显著提升了对历史状态和复杂事件操作的表达能力,尽管计算成本更高,但在句法、统计和语义有效性方面均优于Steve132,展现出在复杂应用场景中生成高质量合成数据的巨大潜力。原创 2025-09-05 15:28:36 · 19 阅读 · 0 评论 -
3、软件协议实现模糊安全测试与合成测试数据生成技术解析
本文深入解析了软件协议实现中的模糊安全测试与合成测试数据生成技术。首先系统梳理了模糊测试中常见的漏洞类型(如缓冲区溢出、空指针解引用等)和攻击类型(如DoS、RCE等),并介绍了开展模糊测试的关键步骤与现有工具的局限性。随后,针对隐私法规限制下的测试数据需求,提出基于领域特定语言(DSL)的合成数据生成方法,以挪威人口登记处为例,设计了新型DSL Steveflex,并通过实验验证其在统计代表性、业务约束符合性和数据丰富度方面优于传统固定格式DSL Steve132。研究结果表明,合理的DSL设计能显著提升原创 2025-09-04 15:27:24 · 45 阅读 · 0 评论 -
2、软件协议实现模糊安全测试的快速综述
本文是对软件协议实现模糊安全测试的快速综述,旨在为从业者和研究人员提供现有方法、工具及发现漏洞的系统性概览。研究围绕四个核心问题展开:测试的协议类型、模糊测试方法分类、可用工具现状以及常见漏洞与攻击类型。通过分析近十年45篇相关文献,发现工业控制系统和物联网协议(如Modbus、MQTT、HTTP)是主要研究对象,多应用于嵌入式系统和客户端/服务器架构。大多数研究提出黑盒模糊测试方法,依赖协议规范或执行样本生成测试用例,并广泛采用变异策略与崩溃检测作为测试预言机。尽管多数论文提出了新工具,但仅有9个开源可用原创 2025-09-03 11:42:49 · 57 阅读 · 0 评论 -
1、软件系统测试前沿洞察与技术剖析
本文围绕2023年9月在意大利贝加莫举行的第35届IFIP WG 6.1国际软件与系统测试会议(ICTSS 2023)展开,深入剖析了软件系统测试的前沿技术与发展趋势。内容涵盖会议概览、组织架构、主题演讲、论文分类及关键技术,重点介绍了模糊安全测试的流程、方法分类与应用现状,并探讨了人工智能在测试中的应用、基于模型的测试深化发展以及安全测试的重要性。文章旨在为软件测试领域的研究者与从业者提供前沿洞察与技术参考,推动测试技术的创新与实践。原创 2025-09-02 11:38:10 · 58 阅读 · 0 评论
分享