[论文阅读] GPT-4 Technical Report

最新推荐文章于 2025-05-24 10:15:47 发布

零澪灵

最新推荐文章于 2025-05-24 10:15:47 发布

阅读量643

点赞数 4

文章标签：论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/moment8aVry/article/details/143268970

版权

启发：

读了吗，如读，不愧是CloseAI

Abstract

GPT-4 是一个基于 Transformer 的模型，经过预先训练，用于预测文档中的下一个标记。训练后的对齐过程可以提高事实性和对期望行为的依从性方面的表现。该项目的一个核心组成部分是开发基础设施和优化方法，这些方法在各种规模上的行为都是可预测的。这使我们能够根据计算量不超过 GPT-4 1/1,000 的模型准确预测 GPT-4 性能。

（由于本文不会介绍GPT-4的模型结构、技术细节，而GPT-4性能不用说都知道是很强的，所以真正值得关注的只有GPT-4仍存在的缺陷和文中提出的可预测扩展的深度学习堆栈）

1 Introduction

GPT-4属于LMM，能够以文本和图像作为输入，输出文本回答。

本篇报告主要涉及以下内容：

展示了GPT-4在各类任务上都能展现出卓越性能；
构建了一个可预测扩展的深度学习堆栈，使得我们能够通过小规模的模型训练来准确预测GPT-4的性能；
揭露GPT-4依旧存在会出现“幻觉”、上下文窗口大小有限、存在安全隐患等问题，同时也描述了可能存在的隐患以及给出预防措施。

5 Limitations

（1）可靠性：GPT-4仍然存在“幻觉”问题，即生成虚假信息和推理错误。在高风险情境下使用GPT-4的输出时需要格外小心。

（2）有限的上下文窗口：GPT-4在处理长文本时存在限制，它无法像人类那样理解和记忆长篇内容。

（3）无法从经验中学习&#x

最低0.47元/天解锁文章

博客等级

码龄5年

38
原创

444
点赞

553
收藏

344
粉丝

关注

私信

热门文章

分类专栏

学习笔记

展开全部收起

最新评论

基于transformer的机器翻译实战
Smilecz0: [code=python] def create_padding_mask(pad, seq): seq = torch.eq(seq, torch.tensor(pad)).float() return seq[:, np.newaxis, np.newaxis, :] [/code] 这个encoder的mask部分是对pad部分使用eq做mask（也就是如果pad，则mask=1）但是attention中是对mask=0的位置最小化，这不是矛盾吗？ [code=python] # 掩码机制：如果mask不为空，就将mask中取值为0的位置的注意力设定为 -1e10 if mask is not None: attention = attention.masked_fill(mask == 0, -1e10) attention = self.dropout(torch.softmax(attention, dim=-1)) [/code]
基于transformer的机器翻译实战
Smilecz0: 数据中实际是<pad>为掩码字符，你代码中使用的pad计算mask，这个是有问题吗？
【论文阅读】Co2l: Contrastive continual learning
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【bug解决】 ImportError: /lib64/libstdc++.so.6: version `CXXABI_1.3.8‘ not found
优快云-Ada助手: 推荐 Python入门技能树：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python
[论文阅读] GPT-4 Technical Report
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。