对抗性网络操作中的适应与欺骗
1. 引言
近年来,计算博弈论(CGT)取得了显著的成功,它能够以超越人类的水平学习并玩一些复杂的游戏,如国际象棋、围棋、将棋、扑克以及多种电子游戏。这些成功在大众媒体和专业文献中都有详尽的记载。
鉴于这些突破性进展,人们很容易认为CGT能立即在其他存在对抗性交流和行为的领域取得类似的突破。由于博弈论与经济学密切相关,因此针对一些新型金融场景,如高频交易,人们提出了新的博弈模型、分析方法和计算方式。此外,这类博弈模型和分析方法也越来越多地被应用于军事和安全领域,包括:
- 认知无线电和频谱分配
- 无人作战飞机(UCAV)作战
- 安全巡逻
- 网络安全
- 欺骗
不过,需要注意以下几点:
- 现实世界中的对抗性作战通常不适合采用目前在简单、规则明确的游戏(如国际象棋、围棋、将棋和扑克)中成功应用的传统学习算法。
- 学习和理性博弈(即在当前对抗性作战模型下短视地优化博弈)是相互排斥的。要学习,就必须牺牲最优博弈;要“理性”操作,就必须牺牲学习。
- 无论一个参与者是否完全理性,对手都有可能利用其适应性博弈来获取自身利益。
- 经济学和计算机科学领域越来越多的人开始质疑,像基于纳什均衡(NE)这样的经典博弈“解”概念,是否适用于动态演变的情况。
因此,在考虑使用基于规则明确的棋盘游戏的流行且成功的机器学习算法时,需格外谨慎。我们认为,要在动态的现实世界对抗性作战中取得成功,需要新一代的机器学习和博弈逻辑。
2. 近期博弈论成功的关键因素
这里回顾一下近期用于构建高性能博弈系统的强化学习及相关方法,这
超级会员免费看
订阅专栏 解锁全文
658

被折叠的 条评论
为什么被折叠?



