人工智能时代,有很多时髦、相互容易混淆概念的科技名词:AI、Machine Learning、Deep Learning、Generative AI、Large Model,它们指的是同一个概念么?不是的。
AI(artificial intelligence人工智能),它的概念最广泛,所有研究人类智能的技术都可以归为其中。
ML(machine learning机器学习),是AI的一个子集,具体指的是通过计算机从数据中学习规律的技术。
DL(deep learning,深度学习),是ML的子集,指的是一种具体的计算机算法,即神经网络。
Generative AI (生成式人工智能),跟AI一样也是广泛的概念,但强调其智能是能够“生成内容”,例如生产文本、生成图片、生成声音,这大大区别于传统的discriminative AI(判别式AI),判别式AI只能预测分类结果,不能生成内容。生成式AI目前使用的算法都是Deep learning。我们现在常用的GPT模型,其全称是Generative Pre-trained Transformer,其中generative是“生成式”的意思,能够生成与训练数据集相似的新数据;Transformer指的是深度学习算法中的一种模型结构。所以,可以理解成深度学习算法在生成内容领域的应用。
Large Model (大模型),泛指参数很多的机器学习模型,因为现在只有深度学习模型有可能有几十亿上百亿上千亿的参数(传统的机器学习模型的参数一般在十几到几十个之间),并且这些参数量大的模型又都主要用于生成内容,所以可理解为参数量大的、用于生成内容的深度学习模型。大模型根据应用场景不同,可进一步细分成语言大模型Large language model(LLM)、图像大模型、音频大模型、视频大模型等。
哪些常见的AI产品
目前国外比较有名的大模型公司及其产品。
OpenAI: 人工智能公司,著名的产品是GPT-4、DALL-E 2、Sora。
GPT-4是一个大语言模型,可完成翻译、撰写文章、回答内容等各种类似文案工作者的任务;Dalle.E是大规模文本到图像的转换模型,在给定文本提示的情况下生成各种样式的真实图像;Sora是通过文字生成视频的模型,是基于GPT和Dalle模型成果在视频领域的应用。
Google:产品是Gemini(之前叫做Bard),功能类似GPT,是基于谷歌自研的大语言模型,跟谷歌自身的产品深度绑定,例如在谷歌邮箱中可以协助写邮件。
Anthropic:OpenAI 前员工共同创立的 AI 公司,推出一款名为 Claude 的类似 ChatGPT的AI助手。
Meta(Facebook):模型产品为LLaMA,参数从 7B 到 70B 不等的大模型,是开源社区中性能最强和最流行的模型。
EleutherAI: 非营利性的人工智能研究实验室,专注于大型模型的可解释性和对齐性,发布了开源的大模型GPT-Neo。
微软:Copilot,一个人工智能驱动的智能聊天机器人,其背后支撑是OpenAI的GPT4。
GitHub Copilot:编程机器人,具有代码自动完成功能,并且可作为大多数流行代码编辑器的插件使用。
Sourcegraph Cody:生成式 AI 编程助手,可以解释代码、为选定代码段创建单元测试、优化现有代码的能力等。
Jasper:AI 营销工具以及写作助手,作为第三方工具利用多个模型,如 GPT-4、Claude、等生成营销活动、将文案翻译成多种语言、撰写博客文章、搜索引擎优化 (SEO)。Sensei GenAI:Adobe公司出品的类似Jasper产品。
l Midjourney: 类似