提升人工智能系统安全性与鲁棒性的方法探索
在人工智能技术飞速发展的今天,如何提升其安全性和鲁棒性成为了至关重要的问题。本文将介绍两种不同的方法,一种是通过纳入输入不确定性来提高用于空中导航的深度神经网络的鲁棒性,另一种是解决强化学习代理中奖励博弈问题的启发式方法。
纳入输入不确定性提升空中导航深度神经网络鲁棒性
在自主系统中,尤其是涉及深度学习组件的系统,不确定性量化方法对于评估其估计的置信度至关重要。为了在安全关键的自主系统中成功部署深度学习组件,不仅要处理输出的不确定性,还应考虑输入的不确定性。
-
自主导航方法概述
- 模块化与端到端方法 :自主导航任务通常通过获取丰富的原始感官信息,然后进行处理以驱动机器人到达目标。常见的实现方式有模块化和端到端(E2E)两种。模块化方法将特定软件组件连接在感知 - 规划 - 控制软件管道中,可使用深度神经网络(DNNs)或其他非学习方法实现。DNNs 因能有效处理复杂感官输入和强大的表示学习能力而受到青睐,但会存在误差累积问题,影响系统整体性能。E2E 方法则直接使用神经网络将感官输入映射到控制输出,常通过模仿学习进行联合训练,但需要大量数据,使用场景受限。
- 混合学习方法 :为了结合两者的优点,一些工作探索了模块化和 E2E 学习方法的结合。这种混合方法通过专用 DNN 学习环境表示和驾驶策略,使自主系统能够纳入基于深度学习的感知和控制模块,学习中间表示有助于提取相关环境特征,用于后续任务。
- 贝叶