生成式 AI 和基础模型
生成式 AI 是人工智能的一种,能够创造新内容和想法,包括对话、故事、图像、视频和音乐。与所有人工智能技术一样,生成式 AI 的能力由机器学习模型提供。这些模型是基于大量数据进行预先训练的大模型,通常被称为基础模型(Foundation Models)。机器学习的最新进展(特别是基于 transformer 的神经网络架构的发明)直接带来这一类模型的爆发式增长,这类模型通常包含数十亿个参数或变量。2019 年最大的预训练模型是 3.3 亿个参数。现在,最大的模型包含的参数超过 5 千亿个,相当于几年间增加了 1600 倍。如今的基础模型,例如大型语言模型 GPT3.5 或 BLOOM,以及由 Stability AI 开发的文生图模型 Stable Diffusion,可以执行跨多个领域的多种任务,例如撰写博客文章、生成图像、解决算术问题、对话聊天,基于文档回答问题等。基础模型的规模和面向通用场景的性质使其不同于传统的机器学习模型,后者通常仅执行特定的任务,例如分析文本观点、分类图像和预测趋势等。
生成式AI利用大规模预训练的基础模型,如GPT3.5和BLOOM,执行多样化任务,从文本生成到图像创造。这些模型基于Transformer架构,参数量在几年间增长了1600倍,展现出了强大的通用性和多领域应用能力。

被折叠的 条评论
为什么被折叠?



