22、关于弗里德曼对扎德枢轴规则的次指数下界研究

关于弗里德曼对扎德枢轴规则的次指数下界研究

1. 引言

单纯形法是解决线性规划问题的重要算法,其核心是维护一组基变量,通过固定的枢轴规则不断替换基变量,直至目标函数值无法再提升。然而,许多自然枢轴规则都存在指数级最坏情况实例,因此寻找多项式时间枢轴规则成为优化领域的重要开放问题。

扎德的最少进入枢轴规则旨在避免其他枢轴规则在已知最坏情况实例下的指数级行为。该规则会选择能改善目标函数且之前被选择次数最少的变量进入基。三十多年来,扎德规则一直难以被构造出超多项式实例,曾被视为多项式枢轴规则的有力候选。

弗里德曼最终为扎德枢轴规则给出了首个超多项式下界。他的构造利用了单纯形算法与马尔可夫决策过程(MDP)的策略迭代算法之间的联系。对于给定的 (n \in N),其构造包含一个大小为 (O(n^2)) 的 MDP、一个初始策略以及一个遵循最少进入枢轴规则的改进切换顺序。从初始策略开始,按指定顺序进行改进切换会导致指数级的迭代次数,这一构造转化为线性规划问题时,使用扎德枢轴规则的单纯形算法需要 (\Omega(2^n)) 步,由于输入规模为 (O(n^2)),从而得到超多项式下界。

2. 弗里德曼的下界构造

弗里德曼利用单纯形算法与 MDP 策略迭代算法的联系进行构造。对于 (n \in N),他用马尔可夫决策过程 (G_n) 模拟一个 (n) 位二进制计数器。对于每个 (n) 位二进制数 (b),都有一个对应的策略 (\sigma_b) 表示它。

(G_n) 由 (n) 个结构相同的层级组成,每个层级 (i) 代表一位二进制数。使用一个大的数 (N \in N) 定义奖励,一个小的数 (\epsilon \geq 0) 定义

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值