本文是LLM系列文章,针对《ChatGPT Alternative Solutions: Large Language Models Survey》的翻译。
摘要
近年来,大型语言模型(LLM)的辉煌不仅在自然语言处理领域大放异彩,而且在众多应用程序中也大放异彩。LLM能力的这一非凡展示引发了该领域研究贡献的激增,涉及各种主题。这些贡献包括神经网络架构、上下文长度增强、模型对齐、训练数据集、基准测试、效率改进等方面的进步。近年来,学术界和工业界之间出现了动态的协同效应,将LLM研究领域推向了新的高度。这一旅程中一个值得注意的里程碑是ChatGPT的推出,这是一款基于LLM的强大人工智能聊天机器人,引起了社会的广泛关注。LLM不断发展的技术已经开始重塑整个人工智能社区的格局,有望在我们创建和使用人工智能算法的方式上发生革命性的转变。鉴于这种快速的技术发展,我们的调查开始了一段旅程,以概括LLM世界最近取得的进展。通过对背景、关键发现和主流方法的探索,我们对文献进行了最新的回顾。通过研究多个LLM模型,我们的论文不仅提供了一个全面的概述,还绘制了一个确定现有挑战并指出未来潜在研究轨迹的过程。这项调查对生成人工智能的现状提供了一个全面的视角,揭示了进一步探索、增强和创新的机会。

本文调查了大型语言模型(LLM)的发展,包括ChatGPT等引起的关注。通过对文献的综合回顾,探讨了LLM的提示工程、OpenAI解决方案及存在的挑战。论文提供了一个全面的LLM全景,分析了不同模型并指出了未来研究方向。
订阅专栏 解锁全文
1917

被折叠的 条评论
为什么被折叠?



