AI与天线技术在网络领域的应用与发展
1. AI赋能智能路由器
在智能路由器的训练阶段,智能体(agent)会依据公式 1 选择执行者(performer)来推进操作:
[P_t = \zeta(S_t|\varphi_{\zeta}) + i_t]
执行者完成任务 (P_j) 后,会检查授权 (G_t),同时底层网络会进入新状态 (N_{s_{t + 1}})。在数据训练时,重复记忆 (M_r) 可减少时间相关性。当前发生的转移 ((N_{s_t} + P_j + M_r + N_{s_{t + 1}})) 会保存到 (M_r) 中,然后使用黑盒优化器(BBO)从 (M_r) 中选择,以相对较短的参数构建周期和任意的 (k) 个转移小批量 ((N_{s_{tK}} + P_{jk} + M_{rk} + N_{s_{tk + 1}})) 来更新评论网络(BBO)。此外,执行者策略会以 BBO 折扣总支出为目标进行修订,如公式 2 所示:
[\Delta_{\varphi_{\zeta}} Q \approx \frac{1}{m} \sum_{i} \sum_{P} Z(S_t, \zeta|\varphi_{\zeta}) | {S_t = N {s_{tk}}, P = \zeta(S_{tk})} \Delta_{\varphi_{\zeta}} \zeta(S_t|\varphi_{\zeta}) | {N {s_{tk}}}]
与传统基于异常的网络路由管理算法相比,进化策略(ES)具有诸多优势:
- 直接处理复杂结构 :深度进化策略(DES)可直接从空间、复杂且高带宽
超级会员免费看
订阅专栏 解锁全文
1337

被折叠的 条评论
为什么被折叠?



