mmm90
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
48、人工智能与信息技术驱动环境下的前沿研究进展
本文综述了人工智能与信息技术驱动下的多个前沿研究领域,涵盖数字人文与文化遗产、低代码/无代码应用开发、分布感知神经符号验证、动态机器学习模型验证以及批蒸馏中神经网络异常检测。文章分析了各领域的核心目标、关键技术与应用场景,并通过对比表格、趋势展望和实际案例揭示其发展动向。强调跨学科合作、技术与需求结合以及持续创新的重要性,展示了AI与IT在推动社会进步中的关键作用。原创 2025-10-07 06:50:13 · 278 阅读 · 0 评论 -
47、人工智能在汽车驾驶与社会应用中的发展与挑战
本文探讨了人工智能在汽车驾驶、社会应用及系统本质三个领域的发展现状与挑战。在自动驾驶方面,尽管技术取得显著进展,但仍面临环境感知、安全保障和验证等难题;在社会应用中,聚焦于AI的可信度、可解释性、公平性与监管问题;同时,从理论层面反思AI系统的本质及其学习范式。文章进一步分析了各领域的共性与差异,提出了加强数据管理、技术创新和跨学科合作的应对策略,并展望了未来发展趋势与潜在机遇,强调通过政策引导、人才培养和国际合作推动AI可持续发展。原创 2025-10-06 15:59:03 · 93 阅读 · 0 评论 -
46、基于深度强化学习的分布式组件系统集成实验
本文提出一种基于深度强化学习的分布式组件系统集成方法,通过简化模型和高级模型实验验证其有效性。该方法采用PPO算法,在统一超参数和训练例程下显著降低失败率,并使组件在有限信息下自适应不同执行速度配置,展现出良好的通用性与稳定性。实验结果表明,该方法在多个示例中优于传统方法,具备处理复杂协同任务的潜力,同时文章也探讨了其局限性及未来在复杂组件与冲突目标场景中的应用前景。原创 2025-10-05 12:31:23 · 39 阅读 · 0 评论 -
45、基于深度强化学习的分布式组件系统集成方法
本文提出了一种基于深度强化学习的分布式组件系统集成方法,采用改进的PPO算法与Actor-Critic架构,通过设计CLIP目标函数和状态值函数优化策略,实现对简化模型与高级模型中组件的有效控制。控制器利用短期与长期历史信息进行决策,结合Boltzmann探索机制提升训练稳定性。在多组件高级模型中,采用分散式训练与并行探索技术,特别是双方同时探索策略,取得了更稳定且可扩展的结果,为复杂分布式系统的自主集成提供了可行方案。原创 2025-10-04 09:37:24 · 30 阅读 · 0 评论 -
44、通过深度强化学习集成分布式组件系统
本文提出了一种基于深度强化学习的分布式组件系统集成方法,适用于由多个黑盒组件构成的多智能体系统。通过结合近端策略优化(PPO)算法与循环神经网络(RNN),在简化模型中最小化系统与环境间的失败交互次数;在更现实的高级模型中,采用异步执行和分布式控制,为每个组件设计独立的深度强化学习控制器。实验结果表明,该方法能有效减少交互失败并提升累积奖励,接近最优策略性能,具有良好的应用前景。原创 2025-10-03 11:23:15 · 26 阅读 · 0 评论 -
43、大语言模型在领域特定建模语言与定理证明中的应用探索
本文探讨了大语言模型(LLMs)在领域特定建模语言(DSMLs)与定理证明中的应用潜力。通过结合自然语言与形式化语言,LLMs支持无代码开发和自动化模型学习,并可在定理证明中辅助生成引理与证明脚本。文章分析了LLMs在软件工程与形式方法中的优势,如降低开发门槛、提升效率,同时也指出了可靠性、可预测性及模型检查复杂性等挑战。最后提出了技术优化方向(如提高可靠性、自动化验证)和应用拓展前景(如跨领域融合、教育应用),展示了LLMs在智能化软件开发与形式化验证中的未来发展方向。原创 2025-10-02 09:11:43 · 39 阅读 · 0 评论 -
42、领域特定建模语言的自然语言扩展
本文提出了一种将领域特定语言(DSLs)与自然语言处理(NLP)相结合的方法,通过图形DSL进行系统结构建模,利用大语言模型(LLM)如ChatGPT生成游戏逻辑代码。该方法采用提示框架和生成框架确保生成代码与现有系统的兼容性,并通过自动部署与模型检查实现运行时属性验证。以点按式冒险游戏为例,展示了从建模、代码生成、合并到验证的完整流程,结合iHTML和CTL等技术实现闭环反馈优化。该方法提升了自然语言生成代码的可控性与可扩展性,为软件工程与智能交互提供了新思路。原创 2025-10-01 12:01:44 · 36 阅读 · 0 评论 -
41、大语言模型助力软件工程:现状、挑战与未来场景
本文探讨了大语言模型(LLM)在软件工程中的应用现状、面临的主要挑战及未来发展的三种可能场景:从增强开发工具到彻底改变软件开发范式。文章分析了LLM在数据安全、模型效率等方面的应对策略,展望了其在系统设计、运营监控、安全验证等领域的研究方向,并介绍了一种结合领域特定语言(DSL)与自然语言(NL)的无代码开发方法。最后讨论了该技术路径的优势与局限,强调需在提升自动化的同时加强验证与规范,推动软件工程向智能化、高效化发展。原创 2025-09-30 16:50:20 · 27 阅读 · 0 评论 -
40、大语言模型辅助软件工程:机遇与挑战
本文探讨了大语言模型(LLMs)在软件工程各阶段的应用,包括需求分析、架构设计、数据建模、API设计、代码生成以及质量保证与测试。通过一个搜索救援机器人的案例研究,展示了LLMs在实际开发中的潜力与局限。同时,文章深入分析了LLMs在集成大上下文、评估生成输出及实际应用中面临的挑战,并提出了相应的解决思路,如分而治之、提示工程、向量数据库、知识图谱融合以及隐私保护措施。最终强调,尽管LLMs为软件工程带来巨大机遇,但人类监督和系统性评估仍不可或缺。原创 2025-09-29 11:23:57 · 38 阅读 · 0 评论 -
39、大语言模型助力软件开发:前景、挑战与实践
本文探讨了大语言模型(LLM)在软件工程各阶段的应用前景与挑战,涵盖需求工程、系统设计、代码与测试生成、代码质量审查等方面。通过案例研究展示了LLM在‘搜索与救援’场景中的实际应用,并分析了其在定理证明、形式化方法及安全可信性方面的潜力与局限。文章还介绍了TriCo集成方法、用户与AI代码助手的交互研究以及ChatGPT在程序开发中的实验,展望了LLM推动软件开发智能化、高效化的未来发展方向。原创 2025-09-28 12:45:50 · 45 阅读 · 0 评论 -
38、神经网络验证基准生成分析与AI辅助编程探讨
本文探讨了神经网络验证基准的构建与分析,以及AI辅助编程在软件开发中的应用与挑战。基于MedNIST和MNIST数据集的实验结果显示,不同的训练组合显著影响模型的验证效率与鲁棒性,尤其是ReLU层的输入范围导致的计算复杂度问题。同时,文章分析了大语言模型在代码生成中的潜力与风险,强调了正确性、安全性和可靠性保障的重要性。通过AISoLA 2023会议的相关研究,展示了DSL结合、形式化方法集成等前沿方向,并提出神经网络验证与AI辅助编程之间的协同可能性,展望了未来在交叉领域的发展路径。原创 2025-09-27 15:32:33 · 49 阅读 · 0 评论 -
37、神经网络验证基准生成的实证分析
本文通过实证分析研究了神经网络训练过程对形式化验证的影响,引入医学图像验证新基准MedNIST,并在MNIST和MedNIST数据集上对45个模型共13500个实例进行验证。研究发现narrow-normal初始化显著提升验证效率,正则化方法和随机种子也影响验证性能,且不同数据集表现出异质性。分析揭示了ReLU层线性规划求解是计算瓶颈,鲁棒性差异主要源于验证近似累积而非模型本身缺陷。文章总结了训练策略启示,提出了未来在数据集、架构、验证方法及训练-验证融合方向的研究展望,并提供了可复现的操作指南。原创 2025-09-26 16:00:48 · 56 阅读 · 0 评论 -
36、语义分割神经网络的验证与鲁棒性评估
本文提出了一种用于语义分割神经网络(SSN)形式验证的基准框架,重点研究其在对抗攻击下的鲁棒性。通过引入无界对抗攻击(UBAA)模拟输入扰动,并采用鲁棒性值(RV)、鲁棒性敏感度(RS)和鲁棒交并比(RIoU)等指标综合评估网络性能。结合Vnnlib标准格式规范输入输出约束与验证属性,利用NNV工具进行基于‘近似星’方法的可达性分析,实现对SSN输出可达集的高效计算与安全性验证。实验结果表明,随着攻击强度增加,RV和RIoU呈下降趋势,揭示了当前模型的脆弱性;而RS的变化则反映了网络对扰动分布的复杂响应。文原创 2025-09-25 09:01:40 · 38 阅读 · 0 评论 -
35、目标检测与语义分割网络的鲁棒性验证
本文探讨了目标检测与语义分割网络的鲁棒性验证方法,重点分析了YOLO模型在海上搜索与救援场景中的鲁棒性评估流程及挑战,并介绍了针对语义分割网络的形式验证框架。通过引入MNIST和M2NIST数据集,设计多样化网络架构,定义鲁棒性属性并展示验证结果,为安全关键应用中的神经网络可信性提供了技术参考。文章还总结了当前的技术难点与应对策略,并展望了未来在算法优化、方法融合与防御机制方面的研究方向。原创 2025-09-24 09:34:56 · 67 阅读 · 0 评论 -
34、航空设备剩余使用寿命预测与海上搜救目标检测基准研究
本文介绍了航空设备剩余使用寿命(RUL)预测与海上搜救目标检测的基准研究。在RUL预测方面,采用基于CNN的深度学习模型处理多变量时间序列数据,并提出稳定性、单调性和If-Then等验证属性;在海上搜救领域,选用YOLOv5-nano模型进行目标检测,关注基于L∞范数的鲁棒性属性。文章分析了两个领域的技术挑战及解决方案,探讨了未来发展趋势,包括多源数据融合、智能化决策、多传感器融合与自主救援系统,旨在为神经网络验证工具提供测试场景,提升系统的可靠性与安全性。原创 2025-09-23 10:56:51 · 40 阅读 · 0 评论 -
33、神经网络恶意软件分类基准:提升安全防护的新途径
本文介绍了用于恶意软件分类的两个神经网络基准:基于特征的BODMAS数据集和基于图像的Malimg数据集。每个基准包含三个难度级别,分别通过扰动数据类型和扰动大小来评估分类器在对抗攻击下的鲁棒性。研究表明,尽管模型在测试集上表现优异,但在鲁棒性验证中仅约50%样本通过,凸显了基准在真实场景评估中的重要性。该框架为提升恶意软件检测系统的可靠性提供了标准化评估手段。原创 2025-09-22 13:24:52 · 36 阅读 · 0 评论 -
32、自动驾驶感知任务神经网络验证基准研究
本文提出了一种针对自动驾驶感知任务的神经网络形式验证基准,涵盖语义分割和目标检测两大核心任务。通过构建简化的Carvana Unet和CCTSDB YOLO模型,结合补丁级干扰方法,实现了从数字世界到现实场景的鲁棒性评估过渡。实验结果表明,所提基准能有效评估现有验证工具的性能,且具备良好的实用性与扩展性,为提升自动驾驶系统的安全性和可靠性提供了有力支持。未来工作将拓展至多任务融合、极端场景数据扩充及实时验证技术研究。原创 2025-09-21 16:07:36 · 56 阅读 · 0 评论 -
31、可信赖学习型自主系统的持续工程与自动驾驶感知任务验证
本文探讨了可信赖学习型自主系统的持续工程方法,涵盖运行时安全监控与增量保证机制,并以麻醉药物目标控制输注和自动驾驶感知任务验证为案例,展示了智能系统在医疗与交通领域的安全性保障技术。研究提出基于分布外感知监控、全局状态监控、STL规范及RTAMT实现的安全架构;构建了融合患者模型与人类护盾机制的麻醉输注测试平台;并针对自动驾驶感知任务,创新性地设计了语义分割与目标检测的鲁棒验证基准及更贴近现实的补丁级干扰方法。最后展望了各领域未来在智能监控、精准控制与复杂验证模型方面的演进方向。原创 2025-09-20 09:49:16 · 59 阅读 · 0 评论 -
30、可信学习型自主系统的持续工程
本文探讨了可信学习型自主系统(LEAS)的持续工程方法,涵盖需求规范与形式化、设计时基于仿真的建模与测试、运行时部署与分析以及保证案例的构建。通过本体驱动的需求表达、P-FO-LTL与STL形式化语言、组件化建模与BIP框架、虚拟测试与SBT技术、运行时多层级监控与规范挖掘,结合ETB框架实现增量式保证,展示了在交通速度检测、自动代客泊车等场景中的应用有效性。文章总结了技术优势,分析了当前挑战及应对策略,并展望了融合AI、跨领域协作、系统自适应与标准化等未来趋势,为LEAS的安全可靠发展提供了系统性解决方案原创 2025-09-19 14:36:44 · 27 阅读 · 0 评论 -
29、可信学习型自主系统的持续工程
本文介绍了可信学习型自主系统(LEAS)的持续工程方法,重点探讨了如何通过形式化规范、可信感知、安全控制、运行时监控和虚拟测试等技术,确保LEAS在复杂现实环境中的正确性与安全性。FOCETA项目提出了一种融合开发与运营的迭代式设计流程,涵盖从需求建模、形式化验证到系统部署和持续更新的全生命周期管理。文章还展示了组合数字孪生架构、高效虚拟测试和规范挖掘等关键技术,并通过汽车、医疗和工业领域的案例研究验证了该方法的有效性与实用性。原创 2025-09-18 16:47:59 · 30 阅读 · 0 评论 -
28、深度神经网络的逆问题求解与应用
本文系统探讨了具有分段仿射激活函数(如ReLU)的深度神经网络(DNN)中逆问题的求解方法,重点研究输出集合的原像计算。通过结合逆仿射映射与逆分段仿射激活函数的数学表达,提出了一种精确计算DNN原像的算法,并分析了其复杂性。文章介绍了该方法在JuliaReach和LazySets中的实现,展示了其在模型可解释性、输入输出关系分析中的应用。为应对计算复杂度挑战,提出了基于区间算术的过近似与欠近似策略,并讨论了适用于非分段仿射激活函数(如sigmoid)的前向-后向传播方法。最后,文章展望了该技术在对抗鲁棒性分原创 2025-09-17 10:42:30 · 47 阅读 · 0 评论 -
27、航空设备基于神经网络的预测系统验证及神经网络逆问题研究
本文研究了航空设备剩余使用寿命(RUL)估计器的性质验证与神经网络逆问题。通过对单调性、局部稳定性的分析,发现估计器在多健康指标同时变化时表现更可靠,且引入有限非单调性可缓解属性违反问题。同时,探讨了分段仿射神经网络的原像计算方法,用于提升模型可解释性与规范验证能力。两者结合为航空系统可靠性评估和神经网络分析提供了相互促进的新路径,并展望了多属性联合验证、实时监测与高效逆算法的发展方向。原创 2025-09-16 12:55:02 · 37 阅读 · 0 评论 -
26、飞机设备基于神经网络的预测系统形式验证
本文介绍了一种基于神经网络的飞机设备剩余使用寿命(RUL)预测系统的形式验证方法。系统以条件指示器(CI)等输入为基础,采用1D卷积与全连接层结合的架构进行RUL回归预测。针对稳定性与单调性需求,文章将要求形式化为局部与全局属性,并采用精确方法、近似方法及两步法进行验证。结果显示,系统在单个CI扰动下稳定性良好,关键寿命阶段的所有稳定性属性均有效;对于多CI扰动,两步法显著提升了验证效率与覆盖率。通过反例分析和局部属性验证策略,研究为RUL模型的安全性提供了保障,并指出了未来在模型优化与验证方法上的改进方向原创 2025-09-15 16:44:58 · 51 阅读 · 0 评论 -
25、深度神经网络安全验证:方法与基准
本文探讨了深度神经网络在安全关键系统中的安全验证方法与基准建设,重点介绍了形式化方法在飞机设备剩余使用寿命(RUL)预测系统中的应用。文章综述了当前神经网络验证的研究进展,包括时间序列模型验证、可达性分析和动态系统建模验证,并展示了多个跨领域验证基准,涵盖自动驾驶、恶意软件检测、海上搜救、工业异常检测等场景。通过将系统需求转化为可验证的数学属性,并结合抽象解释与仿真证伪的混合方法,实现了对卷积神经网络RUL估计器的稳定性和单调性验证。同时,文章分析了形式化验证在全面性、可证明性和潜在问题发现方面的优势,也指原创 2025-09-14 15:19:13 · 73 阅读 · 0 评论 -
24、走向负延迟的形式化解释及深度神经网络安全验证
本文探讨了负延迟与深度神经网络安全验证两个前沿科技方向。在负延迟研究中,通过形式化框架结合马尔可夫决策过程和机器学习策略,实现了在智能抓取等任务中的预测优化,并分析了当前方法的局限性与未来扩展方向。在深度神经网络安全验证方面,综述了包括飞机设备预后系统验证、神经网络逆问题、分布感知验证等多种方法,并介绍了跨领域的验证基准构建及其在国际竞赛中的应用。文章进一步讨论了这两个领域面临的挑战与机遇,提出了未来发展的可能路径,旨在推动关键技术在安全敏感场景中的可靠应用。原创 2025-09-13 14:18:54 · 33 阅读 · 0 评论 -
23、负延迟的形式化解释与机器学习应用
本文介绍了负延迟在目标马尔可夫决策过程(MDP)中的形式化定义及其在机器学习中的应用。通过引入νcϑ-状态k-预测的成本界限,定义了负延迟ℓ为可提前预测目标的最大时间步长,并探讨了其计算方法与逆合成问题。针对系统中策略的不确定性,提出基于L1-马尔可夫链(L1MC)的策略估计方法,利用误差函数界定转移概率的偏差,并结合Weissman不等式提供统计保证。进一步,采用监督学习框架,通过神经网络对连续状态进行策略插值,利用预测熵量化不确定性,并通过模型校准确保置信度可靠性。文章还展示了在抓取任务中的实际应用示例原创 2025-09-12 10:22:51 · 37 阅读 · 0 评论 -
22、马尔可夫决策过程中的目标预测与负延迟分析
本文围绕马尔可夫决策过程(MDP)中的目标预测与负延迟展开研究,介绍了MDP基础中的最小/最大概率与分位数计算方法,构建了带目标的MDP形式化框架,并引入预测映射、预测质量、k-预测等概念。通过算法1和算法2实现了满足质量阈值与成本约束的最优预测,进一步探讨了如何利用预测机制实现负延迟。负延迟通过高置信度的目标预测提前触发系统响应,在通信系统、机器人控制等领域提升效率、优化资源分配并增强可靠性。文章结合理论分析与实例说明,为智能系统中的预测性行为建模提供了系统性解决方案。原创 2025-09-11 13:49:48 · 33 阅读 · 0 评论 -
21、智能采样优化与负延迟的形式化研究
本文探讨了智能采样优化与负延迟的形式化研究。在智能采样方面,分析了重新引入调度器的实验效果及其局限性,并提出了未来扩展方向,包括适应更多系统需求、引入遗传算法利用调度器知识、考虑超属性及应用于随机接口理论。在负延迟研究中,提出了结合预计算与形式化保证的严格定义,构建了基于马尔可夫决策过程(MDP)的框架,用于建模目标导向行为和高质量k-预测,设计了相应的算法并讨论了其在安全关键系统中的应用潜力。同时,文章还介绍了MDP的基础概念及其在成本、概率和策略方面的数学表达,为负延迟的理论分析提供了支撑。原创 2025-09-10 09:15:12 · 37 阅读 · 0 评论 -
20、优化智能采样算法:提升统计模型检查性能
本文针对统计模型检查中的智能采样算法进行优化研究,旨在提升其在复杂系统验证中的性能与稳定性。通过分析原始算法在WLAN和Gossip协议上的表现,发现其存在过早终止、估计不准确和对噪声敏感等问题。为此,提出三项关键优化:完全移除Chernoff界测试以避免早停、为第一步增加额外模拟预算以增强鲁棒性,并探索模拟退火策略的有效性。实验表明,采用选项3(完全移除Chernoff测试)效果最佳,结合第一步预算扩展(a3~10),显著提高识别最优调度器的概率。建议将缩减因子设为5或10,并将改进后的策略作为新基线,以原创 2025-09-09 16:51:45 · 32 阅读 · 0 评论 -
19、深度神经网络鲁棒性评估与智能采样优化
本文探讨了深度神经网络(DNN)的全局类别鲁棒性评估方法,介绍了gRoMA工具在CIFAR10数据集上的应用结果,并分析了计算机系统验证中的测试、形式化验证与统计模型检查(SMC)方法。重点阐述了智能采样技术在MDP框架下的原理、优缺点及改进策略,结合航空与医疗设备的应用案例展示了其有效性。文章还揭示了DNN鲁棒性评估与系统验证之间的关联,提出了未来在多模态评估、实时监控、自适应采样和综合验证平台等方面的发展方向,旨在提升安全关键系统的可靠性与安全性。原创 2025-09-08 12:47:39 · 33 阅读 · 0 评论 -
18、gRoMA:测量深度神经网络全局鲁棒性的工具
本文介绍了一种名为gRoMA的新型工具,用于高效、可扩展地测量深度神经网络(DNN)的全局类别鲁棒性。与仅关注局部鲁棒性的方法不同,gRoMA基于概率全局类别鲁棒性(PGCR)定义,结合RoMA算法与统计聚合技术,能够在不依赖模型内部结构的情况下对黑盒DNN进行评估,并通过Hoeffding不等式提供鲁棒性得分的误差界,具备统计保证。实验表明,gRoMA在CIFAR10数据集上的Densenet模型中成功应用,尤其在飞机类别上表现出高鲁棒性,验证了其在航空航天、自动驾驶和医疗设备等安全关键领域的潜力。原创 2025-09-07 15:48:19 · 27 阅读 · 0 评论 -
17、基于学习的深度强化学习智能体测试
本文提出了一种结合随机自动机学习、概率模型检查、差分测试和统计测试的方法,用于评估深度强化学习策略的安全性和可靠性。通过在《超级马里奥兄弟》游戏环境中的实验,验证了该方法能够有效识别高奖励策略背后潜在的安全隐患,揭示了性能与安全之间的不一致性。研究结果表明,仅依赖累积奖励评估策略是不足的,必须引入专门的安全测试机制。该方法为自动驾驶、工业自动化等高风险领域的RL系统测试提供了可行的技术路径。原创 2025-09-06 15:34:31 · 54 阅读 · 0 评论 -
16、深度强化学习智能体的基于学习的差分测试
本文提出了一种基于学习的差分测试方法,用于评估深度强化学习智能体的安全性。该方法结合自动机学习技术,通过构建环境的抽象模型(确定性标记MDP),生成针对性的测试用例,并在多个策略间进行差分比较,以发现潜在的安全缺陷。整个流程包括自动机学习、测试用例生成和执行三个阶段,支持对RL策略在特定观测覆盖下的安全性进行系统化验证。文章以超级马里奥兄弟游戏环境为例展示了方法的有效性,并探讨了其优势与局限,为强化学习系统的安全测试提供了新的思路和技术路径。原创 2025-09-05 12:52:01 · 45 阅读 · 0 评论 -
15、形式化可解释人工智能与基于自动机学习的深度强化学习代理差分安全测试
本文探讨了形式化可解释人工智能与基于自动机学习的深度强化学习代理差分安全测试两项研究。在可解释AI方面,通过不同语法(如四分位数、六分位数、决策树引导语法)使用SyGuS方法合成模仿程序,评估其在医疗数据集上的可解释性、合成时间与准确性,并与scikit-learn决策树对比;实验表明模仿程序具有良好的局部和全局近似能力。在深度强化学习测试方面,提出结合IOAlergia算法、概率模型检查、差分测试与统计测试的方法,对RL代理进行安全性评估,成功识别出奖励表现相似但安全性不同的策略。研究为可信AI与安全强化原创 2025-09-04 13:26:01 · 26 阅读 · 0 评论 -
14、基于语法引导合成的形式化可解释人工智能
本文提出了一种基于语法引导合成(SyGuS)的形式化可解释人工智能方法,通过生成模仿程序来解释复杂黑盒模型的决策过程。该方法利用输入-输出示例作为语义约束,并结合针对图像和表格数据设计的特定上下文无关文法作为语法约束,合成简洁且可解释的替代模型。在MNIST和Pima Indians糖尿病数据集上的实验表明,所生成的模仿程序在保持高全局准确性的同时,具有优于决策树的可解释性,尽管其合成时间相对较长。未来工作将聚焦于优化合成效率、降低程序深度并拓展应用范围。原创 2025-09-03 11:15:28 · 29 阅读 · 0 评论 -
13、安全弹性混合系统与可解释人工智能的研究进展
本文综述了安全弹性混合系统与可解释人工智能的最新研究进展。在安全弹性混合系统方面,对比了Q-learning与Deep Q-learning在Simulink和HYPEG ML平台上的训练效率与性能优化结果,探讨了不同时间界限和奖励机制对系统弹性与成本的影响。在可解释人工智能方面,提出基于语法引导合成(SyGuS)的模仿程序方法,利用一阶逻辑公式和条件语句语法生成可解释模型,提升复杂机器学习模型的透明度与可信度。文章进一步分析了两个领域的关联性,并展望了未来在应用场景拓展、方法融合与技术深化方面的研究方向。原创 2025-09-02 10:41:32 · 30 阅读 · 0 评论 -
12、智能水分配系统的安全、弹性与性能优化
本文探讨了智能水分配系统的安全、弹性与性能优化方法。通过扩展Simulink模型以随机建模泵的故障与修复,结合混合合同在KeYmaera X中对系统进行安全与弹性保障的形式验证,并引入基于统计模型检测(SMC)的强化学习框架优化系统性能。采用Q-learning和Deep Q-learning等方法,在不同工具(Simulink与HYPEG ML)下对比弹性与性能属性的优化效果。结果表明,Deep Q-learning在长期模拟中表现更优,而HYPEG ML因高效模拟支持大规模训练,在短时任务中具备竞争力。原创 2025-09-01 11:36:29 · 24 阅读 · 0 评论 -
11、保障混合系统安全与弹性:Simulink中的方法与应用
本文介绍了一种在Simulink中保障智能混合系统安全与弹性的综合方法,结合微分动态逻辑(dL)的演绎验证与统计模型检查(SMC)的量化分析。通过将Simulink模型自动转换为dL进行形式化验证,并引入故障与修复的随机建模及非确定性过度近似,确保系统在各种异常情况下的安全性与弹性。同时,利用STL属性编码和强化学习相结合的SMC学习方法,在满足关键安全属性的前提下优化系统性能。该方法适用于包含RL组件的复杂混合系统,如智能水分配系统,并可推广至其他安全关键领域。原创 2025-08-31 11:13:39 · 27 阅读 · 0 评论 -
10、深度学习测试算法评估与智能混合系统安全构建研究
本文研究了深度学习测试算法的评估与智能混合系统的安全构建。通过在多个数据集和预训练模型上对比DeepGini、DeepAbstraction和DeepAbstraction++算法,验证了DeepAbstraction++在故障检测率(WFDR)上的优越性,并分析了裁决权重的有效性、性能稳定性及组合策略的影响。同时,在智能混合系统方面,提出结合Simulink、演绎验证与基于统计模型检查的学习方法,构建可证明安全、弹性且高性能的系统,应用于智能水分配等关键基础设施。实验结果表明该方法能有效生成接近最优的调度原创 2025-08-30 13:02:35 · 48 阅读 · 0 评论 -
9、DeepAbstraction++:提升深度学习系统测试优先级性能
本文提出DeepAbstraction++,一种针对深度学习系统测试优先级排序的改进框架。通过引入动态tau选择、组合参数化盒子、加权裁决策略和多种组合策略,解决了原DeepAbstraction在参数敏感性和裁决单一性方面的缺陷。实验表明,该方法在性能上比现有领先算法提升2.38%至7.71%,显著增强了排序稳定性并降低了标记成本,为DNN系统的高效可靠性验证提供了有力支持。原创 2025-08-29 10:45:53 · 48 阅读 · 0 评论
分享