时变有损网络中的源路由策略研究
1. 引言
在时变有损网络中,寻找高效的路由策略至关重要。由于求解贝尔曼方程以获得最优策略在路径数量和跳数增加时变得难以处理,因此需要研究近似最优的解决方案。本文将介绍基于索引的策略,包括近视策略和惠特尔指数,以及一种新的路由路径度量——谐波折扣指数(HDI),并通过实验评估其性能。
2. 基于索引的策略
2.1 索引策略概述
索引策略是为每条路径的每个状态分配一个索引,并选择索引最高的路径进行传输的选择协议。一些路径索引具有强可分解性,即可以独立计算每条路径的索引,而不考虑其他路径的状态,这降低了问题的复杂度。本文将研究两种适用于多跳路径的索引策略:近视策略和惠特尔指数。
2.2 近视策略
2.2.1 近视策略原理
近视策略将选择路径的即时预期奖励作为索引,通过忽略未来折扣奖励对决策的影响,显著降低了计算复杂度。对于随机相同的单跳(信道),这种近视策略可以保证得到最优解,但对于非相同跳数且奖励相等的情况或多跳路径,相关研究较少。
2.2.2 完全无记忆跳的情况
当通信跳满足 (1 - \beta_{k,j} = \alpha_{k,j}) 时,跳变为完全无记忆的,此时信念 (w_{k,j}) 保持恒定,即 (w_{k,j} = 1 - \beta_{k,j} = \alpha_{k,j} = \tau(w_{k,j}))。在一组由 (n) 个完全无记忆跳组成的 (K) 条独立路径中,近视策略是最优的,并且由于所有跳的信念保持不变,最优策略可能在所有决策时刻仅通过一条路径进行传输。
超级会员免费看
订阅专栏 解锁全文
912

被折叠的 条评论
为什么被折叠?



