ChatGPT理论分析

原创已于 2024-01-30 17:03:48 修改 · 5.4w 阅读

250 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #人工智能 #ChatGPT #GPT #世界杯

于 2022-12-08 23:00:14 首次发布

深度学习论文与相关应用专栏收录该内容

101 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

团队模型、论文、博文、直播合集，点击此处浏览

一、背景

这里我就直接贴上跟ChatGPT的对话作为背景输入，说真的，它的回答比我写的还要专业，具体见如下截图：

二、原理

从官网介绍可以看到，ChatGPT与InstructGPT是同源的模型。那么接下来我们来看下什么是InstructGPT。从字面上来看，顾名思义，它就是指令式的GPT，“which is trained to follow an instruction in a prompt and provide a detailed response”。接下来我们来看下InstructGPT论文[1]中的主要原理：

从该图可以看出，InstructGPT是基于GPT-3模型训练出来的，具体步骤如下：

步骤1.）从GPT-3的输入语句数据集中采样部分输入，基于这些输入，采用人工标注完成希望得到输出结果与行为，然后利用这些标注数据进行GPT-3有监督的训练。该模型即作为指令式GPT的冷启动模型。

步骤2.）在采样的输入语句中，进行前向推理获得多个模型输出结果，通过人工标注进行这些输出结果的排序打标。最终这些标注数据用来训练reward反馈模型。

步骤3.）采样新的输入语句，policy策略网络生成输出结果，然后通过reward反馈模型计算反馈，该反馈回过头来作用于policy策略网络。以此反复，这里就是标准的reinforcement learning强化学习的训练框架了。

所以总结起来ChatGPT（对话GPT）其实就是InstructGPT（指令式GPT）的同源模型，然后指令式GPT就是基于GPT-3，先通过人工标注方式训练出强化学习的冷启动模型与reward反馈模型，最后通过强化学习的方式学习出对话友好型的ChatGPT模型。如下是论文中相应对话友好型的定量结果（其中PPO-ptx曲线就是InstructGPT模型），可以看到在回答友好型上InstructGPT是远超原始GPT的：

ChatGPT它非常擅长对话、情感分析、文本生成、摘要提取等，有了这些直接打开了更广阔的应用面。可想而知，如若在垂直领域做定向训练，它将会发挥出更极致的性能，即可作咨询用途，同时也可以辅助创作（这将颠覆很多行业的工作方式）等等。

效果是非常惊艳的，使用完之后的体感是这应该能辅助到各行各业中，应用空间无限大，这类技术可能会成为未来AI系统的基石应用之一。

三、其他

文生图体验，文章《人工智能内容生成元年—AI绘画原理解析》中已介绍到Midjourney的用户通过该文生图的能力，在美国科罗拉多州举办的艺术博览会，《太空歌剧院》的画作获得数字艺术类别冠军。相应参与界面如下：

四、文献

[1]InstructGPT：https://arxiv.org/abs/2203.02155

您可能感兴趣的与本文相关的镜像

GPT-oss:20b

图文对话

Gpt-oss

GPT OSS 是OpenAI 推出的重量级开放模型，面向强推理、智能体任务以及多样化开发场景

16 条评论

2201_75543054 2023.02.15
账户 d

奇异果酱 2023.02.09
这算见证了历史吗也许现在就是一个转折点[face]emoji:043.png[/face]
- 奇异果酱回复AI记忆 2023.02.15
  大佬的文章写得很好[face]emoji:055.png[/face]
- AI记忆回复奇异果酱 2023.02.09
  哈哈，我们绝对见证了重大时刻。

huangoramy52 2022.12.20
在经济萧条的至暗时刻，看到某一科技领域已经开始闪烁着微光，令人感到兴奋无比。
- AI记忆回复huangoramy52 2022.12.20
  [face]emoji:015.png[/face][face]emoji:015.png[/face][face]emoji:015.png[/face]

郭富城恰鸡 2022.12.13
使用这个的软件还是程序员，
- AI记忆回复郭富城恰鸡 2022.12.13
  [face]emoji:010.png[/face][face]emoji:010.png[/face]以后国内商业化应该都会跟上，会面向更多用户，哈哈

qq_41441842 2022.12.11
未来突然就猝不及防的来了
- AI记忆回复qq_41441842 2022.12.11
  [face]emoji:015.png[/face]技术进展飞速啊，期待国内相应商业化应用的早日出现[face]emoji:023.png[/face]为AI应用再浇点油！

anli_____ 2022.12.11
这情书emm
- AI记忆回复anli_____ 2022.12.11
  [face]emoji:010.png[/face][face]emoji:010.png[/face]以后程序员也会写情书了
- AI记忆回复anli_____ 2022.12.11
  [face]emoji:010.png[/face][face]emoji:010.png[/face]以后程序员就最会写情书了

m0_56987536 2022.12.11
ChatGPT有很多潜在的用例，包括：作为聊天机器人、作为一个问答系统、作为对话代理、作为文本生成工具等等，随着自然语言处理和语言建模领域的快速发展，ChatGTP也会有更多的改进空间，使其更通用更强大。
- AI记忆回复m0_56987536 2022.12.11
  是的，没错，期待未来啊[face]emoji:015.png[/face]