生成式AI与机器学习应用全解析
生成式AI概述
传统上,机器学习主要解决分类和回归问题。而如今,生成式AI这一新兴的AI形式正崭露头角。生成式AI属于深度学习的一种,在2020年代初开始受到广泛关注。其模型输出可以是文本、图像、音乐、视频等多种形式。
例如,像ChatGPT这样的大语言模型(LLM),通过向其展示大量自然语言文本进行训练,使其能够根据前文预测最可能的后续词汇。使用时,给定一个提示,它会生成一组初始词汇,然后根据这个初始序列和提示以合理的方式完成整个句子。同样,图像生成模型通过训练来预测像素值,语音模型则可以生成音频频率和振幅值。
生成式AI最初应用于句子补全(如Gmail的智能撰写)和代码补全(如Tabnine、GitHub Copilot)。如今,越来越多复杂的产品开始利用生成式AI生成销售、营销等领域的电子邮件和文章初稿。
大语言模型的工作原理
ChatGPT、Bard、LLaMa等大语言模型经过训练,能够以多种风格和目的生成文本,同时保持较高的准确性和细节度。最基本的是,这些模型能够完成句子。例如,当输入“We were floating”时,模型可能会给出如下续写建议:
- … on the river [80%]
- … in space [15%]
这是因为语言模型学习了大量已发布的示例,如演讲、文章、书籍、评论等,从而了解哪些词汇更可能跟随其他词汇。当输入包含“rocket”或“summer”等词汇的短语时,后续词汇的相对概率会发生变化。基于广泛的训练数据集,模型能够适应上下文,生成看似准确、详细且连贯的响应。
在训练阶段,大语言模型学会了关注哪些
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



