MLGO微算法科技 LOP算法：实现多用户无线传感系统中边缘协同AI推理的智能优化路径

最新推荐文章于 2025-11-23 19:13:18 发布

原创最新推荐文章于 2025-11-23 19:13:18 发布 · 459 阅读

CC 4.0 BY-SA版权

文章标签：

在智能化时代，人工智能（AI）与无线通信技术的融合，正在为人类社会带来一场深刻的变革。尤其是在物联网（IoT）和无线传感系统（WSS）领域，利用无线电信号对环境与行为进行智能识别成为前沿研究的热点。无线传感（Wireless Sensing）作为一种无源、隐私友好且不依赖摄像头的感知技术，被广泛应用于智慧城市、安防监控、健康护理等多个领域。尤其是在室内人群计数、行为识别等任务中，AI 模型通过解析信道状态信息（CSI）等物理层信号，能够精准判断人体活动模式，大幅度提升了环境智能感知的能力。

然而，随着AI模型的规模和复杂度不断上升，部署在传感器设备（Sensor Devices，简称 SD）上的深度学习模型往往面临巨大的计算压力。同时，由于SD在通信和计算资源方面的先天限制，传统的端侧推理或完全卸载至边缘服务器（Edge Server，简称 ES）的方式，已无法满足对推理延迟和能耗的双重严格要求。因此，如何在资源受限的条件下，智能地调度AI模型在设备和边缘间的推理协作，成为亟需解决的关键难题。

在设备边缘协同推理（Device-Edge Collaborative Inference）框架中，AI模型被划分为多个部分，部分在设备端执行，剩余部分在边缘服务器上完成。这种协同机制可以显著减轻设备的计算负担，并利用边缘计算资源提升整体推理性能。然而，模型切分点（即模型在设备和边缘之间的划分位置）和资源分配（如无线带宽、功率、时间等）的设计，构成了一个复杂的混合优化问题。

首先，不同用户的AI模型分裂位置决定了设备上传数据的体积和结构，这将直接影响通信时延和计算延迟。其次，边缘服务器资源有限，不同用户间的资源分配方案必须考虑协同竞争与共享的平衡。此外，由于用户所处的信道条件不同（如信道增益变化），模型切分的最优位置在空间上呈现异质性，即没有统一的最佳切分点可以适用于所有设备。因此，该问题不仅涉及深度学习模型结构的分析，还需引入智能调度与优化算法进行联合求解。

为了系统性地解决上述挑战，微算法科技（NASDAQ:MLGO）提出了一种集成学习与优化算法——LOP（Learning-Optimization Policy）框架，该方法创新性地将深度强化学习（Deep Reinforcement Learning, DRL）与凸优化技术相结合，分别处理模型分裂与资源分配两个子问题，从而高效求解整个设备边缘协同推理任务。

微算法科技 LOP算法的核心思想是将问题分为两个阶段：

第一阶段：使用深度强化学习进行模型分裂点选择

模型分裂问题本质上是一个组合优化问题。在每个设备SD上，深度神经网络可以被切分成若干连续层，而模型分裂点的选择决定了设备需要处理的层数与数据上传量。微算法科技使用强化学习中的策略梯度方法，训练一个智能体（agent）来根据当前的网络状态（如设备能耗预算、信道状态、边缘负载等）预测最优的模型切分点。该方法具有良好的泛化能力，并可以根据环境动态调整策略。

第二阶段：通过凸优化进行系统资源的联合分配

在第一阶段确定模型切分点之后，系统进入第二阶段，即根据分裂结构和用户需求，进行无线资源（如带宽、时间片、计算能力等）的联合优化。此时，由于切分结构已定，系统资源的优化问题可被转化为一个约束条件明确的凸优化问题，从而使用经典的凸优化算法（如内点法、梯度下降等）求解。在这一阶段，重点考虑能量最小化目标，同时约束推理延迟不超过某一阈值。

微算法科技 LOP算法实现了“感知-决策-优化”三位一体的智能协同流程。它不仅提升了模型分裂与资源调度的效率，而且显著降低了系统的整体能耗与通信延迟。

在工程实现中，一个多用户无线传感系统，系统由多个传感设备SD、边缘服务器ES、和后端控制器组成。每个SD部署有轻量级神经网络模型，在前端负责初步特征提取。处理后的中间特征被压缩后上传至ES，ES上的后续模型部分完成最终的推理判断，如人群计数、人体动作识别等任务。

整个系统通过控制器实现以下关键功能：

感知状态更新：定期从SD收集信道状态、剩余电量、数据队列等信息；

分裂策略学习：在控制器中部署DRL智能体，预测每个设备的模型切分策略；

资源分配优化：在DRL输出后，调用凸优化求解器进行边缘资源精确分配；

推理协同执行：SD与ES按照下发指令同步执行AI模型推理任务。

该系统基于软件定义网络（SDN）架构，具备高度可编程性与灵活性，适应大规模设备部署环境下的高并发协同推理需求。

在实验中，该系统模型切分点随着用户信道增益的变化而呈现出明显的阈值行为。具体而言，当设备信道条件良好时，模型切分点趋于靠后，意味着设备可以执行更多计算任务；而在信道恶劣时，模型尽可能前移，将大部分任务交由边缘服务器完成，从而减少上传数据体积与能耗。

微算法科技（NASDAQ:MLGO） LOP算法创新性地将深度强化学习与凸优化方法结合，成功解决了模型分裂与资源分配耦合带来的复杂性，显著提升了系统在延迟与能耗之间的优化能力。通过实验验证，该技术在性能与可行性方面均表现出色，展示了其作为下一代边缘智能支撑方案的巨大潜力。

更重要的是，这项技术不仅具备理论价值，更具备强大的工程适用性与可扩展性。它突破了传统边缘推理“单点切分、平均分配”的思维定式，实现了感知系统由“固定模式”向“动态协同”的智能跃迁，为未来智慧城市、智能医疗、工业感知等多场景应用提供了统一的边缘AI推理解决方案。其通用框架与模块化设计，也为未来的跨设备、跨场景部署打下了良好基础。

展望未来，随着6G、物联网、边缘计算等基础设施的进一步成熟，微算法科技 LOP算法将在更大规模、多模态、多用户的智能环境中展现更强适应能力。期待这项技术继续拓展其边界，推动AI模型在真实世界中的智能部署方式不断演进，助力构建一个真正智能、高效、绿色的无线感知新时代。