本文是LLM系列文章,针对《Large Language Models for Networking: Workflow, Advances and Challenges》的翻译。
摘要
网络领域的特点是其高度复杂性和快速迭代,需要广泛的专业知识来完成网络任务,包括网络设计、配置、诊断和安全。这些任务的固有复杂性,加上不断变化的网络技术和协议,给传统的基于机器学习的方法带来了重大障碍。这些方法通常很难在网络中泛化和自动化复杂的任务,因为它们需要大量的标记数据、特定领域的特征工程和频繁的再训练来适应新的场景。然而,最近大型语言模型(LLM)的出现引发了应对这些挑战的新一波可能性。LLM在自然语言理解、生成和推理方面表现出了非凡的能力。这些基于大量数据训练的模型可以使网络领域受益。一些努力已经探索了LLM在网络领域的应用,并显示出有希望的结果。通过回顾最近的进展,我们提出了一个抽象的工作流程来描述将LLM应用于网络的基本过程。我们按类别介绍现有作品的亮点,并详细解释它们在工作流程的不同阶段是如何运作的。此外,我们深入研究了遇到的挑战,讨论了潜在的解决方案,并概述了未来的研究前景。我们希望这项调查能够为研究人员和从业者提供见解,促进这一跨学科研究领域的发展。