GPT-4 Turbo 发布 | 大模型训练的新时代:超算互联网的调度与调优

本文聚焦OpenAI开发者大会,介绍了GPT-4 Turbo等发布亮点。同时阐述了算力后周期市场需求,包括云化、调优等环节。全球算力后周期呈现不同生态,海外软件服务在数据管理、模型落地和训练可视化有进展。还介绍了蓝海大脑大模型训练平台的特点和配置。

 ★OpenAI;ChatGPT;Sam Altman;Assistance API;GPT4 Turbo;DALL-E 3;多模态交互;算力调度;算力调优;大模型训练;GH200;snowflake;AGI;AIGC;H100;A100;DGX Cloud 集群;Base Command;GPU算力;华为 Atlas 900 集群;NVIDIA NVLink;开发者大会

北京时间11月7日凌晨2点,OpenAI在旧金山举行的开发者大会吸引了全球的关注。在不到一小时的线上发布会上,OpenAI发布许多重磅消息,鼓励企业使用OpenAI的技术构建基于人工智能的聊天机器人和自主智能体。

算力对训练模型的重要性日益凸显。随着大模型训练的流行,全球显卡和算力正在快速增长。算力后周期市场也在迅速崛起。其中“后”更多是指后服务市场,涵盖从显卡服务器到货IDC之后,形成稳定算力到输出稳定商业推理结果全过程。该过程主要涉及云化、调优、调度、部署、落地和数据管理等环节。

算力的后周期

大模型训练困难、商用成本高昂和安全问题担忧,催生算力后周期市场需求。大模型训练面临超大规模参数和运算量问题,需要解决显卡之间数据并行和运算合作,使得后周期需求如云化、调优、调度等应运而生。参数多则准确度高,而反应时间和消耗费用也愈增,开发者需要面对如何快速将新模型部署到应用场景问题。另外,大模型安全问题也令人担忧,需要考虑如何实现在保证数据安全的前提下,企业原有数据库与训练系统的相互调用,以及如何实现原有数据对“AI”训练的可用等。

全球算力后周期发展呈现出两个截然不同生态。在涉及算力使用和大模型训练等上层建筑时,整个行业对于资本支出、模型经验积累等方面的壁垒正在逐渐加深。大模型时代,天量资本支出已经成为入场券,模型研究从“巧夺天工”到“重剑无锋”的转变,使得大算力、大模型的壁垒不断提高,行业格局加速走向巨头通吃。

Buy More Save More 的典型代表 英伟达GH200 芯片

在商业落地、数据安全和平台可视化等模型下游环节中,北美创业公司展现出百花齐放的生态。在训练过程与资源可视化、数据库调用、模型加速部署与性价比调节等方面,涌现出一批优秀创业公司与解决方案。同时,原有领域龙头软件公司也在积极开发方案,对接AI需求。与大模型和算力战争中的巨头垄断不同,这个领域各个环节充满生机,更容易在细分环节中成长出新的优秀独角兽公司。

 

数据库巨头 Snowflake 与英伟达合作

随着国内算力资源增长和模型训练深入,对算力和模型层面的投资将重新聚焦。受海外算力制裁的影响,国内如昇腾等国产优秀生态发展和起量过程中,可能也将涌现出一批优秀的行业加速库、生态软件公司,扩展出具有中国特色的相关模型服务体系,走出一条有中国特色的模型服务体系之路。

OpenAI开发者大会亮点

OpenAI CEO Sam Altman在会上介绍了公司的一系列重要进展,包括推出新的GPT-4 Turbo模型,该模型具有更强大的功能、更长的上下文和更强的控制能力。同时,OpenAI还推出Assistance API,旨在简化开发者构建辅助代理。

Altman强调自然语言将成为未来与计算机互动的重要方式,并展示通过对话编程GPT的能力。GPT商店即将推出,允许用户分享和发现创新的GPT应用,并提供收入分享激励。此外,OpenAI还与微软深化合作,展示新的文本到语音模型和改进的功能调用。

一、GPT4 Turbo发布

GPT-4 Turbo,在6个方面对GPT-4进行升级:

  • 上下文对话长度:GPT-4 Turbo支持更长的上下文对话长度,达到128K,是GPT-4的16倍。

  • 模型控制:采用新模型控制技术,使开发者更精细地调整输出,提升用户体验。

  • 知识库更新:至2023年4月,比GPT-4的知识库新近2年。

  • 多模态API:集成DALL-E 3、带视觉输入的GPT-4 Turbo和新的语音合成模型。

  • 定制微调:允许开发者针对特定领域进行自定义微调。

  • 更低价格和更高限制:价格更低但使用限制更高,输入输出token价格仅为GPT-4的1/3和1/2,每分钟限制提升一倍。

Sam Altman声称,GPT-4 Turbo可供所有付费开发者通过gpt-4-1106-preview API进行尝鲜,相关稳定版本预计将在未来几周内发布。

二、GPT Store将上线

定制版GPT可以根据用户日常生活、特定任务或工作需求提供个性化帮助,如学习棋类游戏规则、辅导孩子数学、提高写作能力或设计贴纸等。用户甚至可以与他人分享自己定制的GPT。

用户无需编程就可以创建自己的GPT,过程非常简单,只需给GPT输入指令和知识,然后选择其功能,例如网络搜索、图像生成或数据分析。定制GPT可以私人使用,也可以面向公司内部或制作公共通用版本。

OpenAI正在为ChatGPT Plus和企业版ChatGPT用户提供定制GPT示例,例如AI图像生成应用Canva和自动化平台Zapier。从本周三开始,企业版用户可以为特定客户、部门或数据集创建自己的ChatGPT,并可以授权内部用户无代码设计企业定制GPT,并安全发布到内部工作区。管理控制台可以选择如何在公司内共享这些GPT,以及是否允许使用外部GPT。

三、New GPT Draft

OpenAI表示,即使不会编程也可以制作GPT模型。只需与ChatGPT聊天,描述需求,就可以定制一个GPT模型,使GPT变得非常容易使用,可为每个人提供代理权,做想做的事。

四、全面的API助手

API是一种计算接口,规定了不同软件组件之间的交互方式、可进行调用或请求的种类、如何进行调用或请求,以及应使用的数据格式和应遵循的惯例等。

根据OpenAI公司的官方信息,目前使用GPT-4和GPT-3.5 Turbo上传750词的文档分别需要支付0.06美元和0.003美元(以最高速度计算)。在这次大会上,OpenAI还发布具有记忆功能的内存存储API,可以提高大模型的计算速度,并将开发者的API调用成本降低95%。

此外,OpenAI还发布专门的Assistants API,使开发人员可以更轻松地构建自己的辅助AI应用,调用模型和工具以实现自己的目标。

Assistants API 提供代码解释、检索和函数调用等新功能,帮助开发者处理繁重工作,从而构建高质量AI应用。OpenAI介绍,这种API是为了灵活性设计,用例范围广泛,包括基于自然语言的数据分析应用、编码助手、AI驱动的假期规划器、语音控制DJ、智能视觉画布。Assistants API功能和新GPT产品相同,都支持自定义指令和一些工具,例如代码解释器、检索和函数调用。

五、多模态交互

新版本GPT增加多模态功能,包括视觉、图像创建和文本转语音。GPT-4 Turbo可以接受图像作为输入,从而实现生成标题、分析现实世界图像和阅读带图形文档等用例。视觉输入的定价根据图像大小而定。

此外,OpenAI计划为主要GPT-4 Turbo模型提供视觉支持。对于新版本GPT付费用户,主要功能更新包括更方便地上传多种格式文件,如PDF、数据文件等(未来将支持更多文件类型)。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值