- 博客(21)
- 收藏
- 关注
原创 关于人机关系的一些想法以及我们在 OpenAI 如何处理这种关系
为什么人们会在情感上依恋人工智能,我们如何看待“人工智能意识”的问题。我们是否会对AI真正的产生情感依恋和关怀。这如何影响我们试图塑造模型行为的方式。
2025-06-09 14:45:48
675
原创 追踪大型语言模型的思想(下)(来自针对Claude的分析)
对于AI模型开发者来说,AI的策略是难以捉摸的。这意味着我们无法理解模型是如何完成大部分工作的。另外,AI能说几十种语言。它“在脑子里”用的是什么语言?(如果有的话)?AI每次写一个词。它只专注于预测下一个词,还是会提前计划?AI可以一步一步地写出它的推理过程。这种解释代表了它得出答案的实际步骤,还是它有时会为一个既定的结论编造一个看似合理的论据?AI又是怎么做算术的呢?它竟然不像CPU的进位制实现的。这一点也很有趣。
2025-05-07 18:02:17
748
原创 追踪大型语言模型的思想(上)(来自针对Claude的分析)
对于AI模型开发者来说,AI的策略是难以捉摸的。这意味着我们无法理解模型是如何完成大部分工作的。另外,AI能说几十种语言。它“在脑子里”用的是什么语言?(如果有的话)?AI每次写一个词。它只专注于预测下一个词,还是会提前计划?AI可以一步一步地写出它的推理过程。这种解释代表了它得出答案的实际步骤,还是它有时会为一个既定的结论编造一个看似合理的论据?AI又是怎么做算术的呢?它竟然不像CPU的进位制实现的。这一点也很有趣。
2025-05-07 17:51:05
948
原创 关于AI安全的:When, Why, What, and How(下)
我们认为,人工智能可能会在未来十年内对世界产生前所未有的影响。计算能力的指数级增长和人工智能能力的可预测的发展表明,新系统将比当今的技术先进得多。然而,我们还没有完全理解如何确保这些强大的系统与人类价值观紧密结合,以便我们能够确信灾难性故障的风险最小。
2024-12-23 17:26:29
759
原创 关于AI安全的:When, Why, What, and How(上)
人工智能的影响可能堪比工业革命和科学革命,但我们不确定它会不会顺利。我们还相信这种程度的影响可能很快就会到来——也许在未来十年。当系统开始变得像设计者一样智能,对周围环境的感知也越来越强时,构建安全、可靠且可操控的系统可能会变得很棘手。人工智能的快速发展将带来巨大的破坏性,改变国家内部和国家之间的就业、宏观经济和权力结构。
2024-12-16 18:19:16
1076
原创 如何绘制大型语言模型(下)
我们之前研究过阿谀奉承,即模型倾向于提供符合用户信念或愿望而非真实想法的响应。在 Sonnet 中,我们发现了与阿谀奉承赞美相关的特征,当输入包含“您的智慧不容置疑”之类的赞美时,该特征就会激活。人为地激活该特征会导致 Sonnet 用这种华丽的欺骗来回应过度自信的用户。
2024-11-01 19:26:20
884
原创 如何绘制大型语言模型(上)
我们通常将人工智能模型视为黑匣子:输入一些东西,输出一个响应,但不清楚为什么模型会给出一个特定的响应而不是另一个响应。这让我们很难相信这些模型是安全的,如果我们不知道它们是如何工作的,我们怎么知道它们不会给出有害的、有偏见的、不真实的或其他危险的响应呢?我们怎么能相信它们是安全可靠的呢?
2024-11-01 19:22:49
634
原创 OpenAI o1 简介
OpenAI o1,这是一种新的大型语言模型,经过强化学习训练可以执行复杂的推理。o1 在回答之前会思考——它可以在回应用户之前产生一个长长的内部思路链(a chain of thought )。
2024-10-16 22:10:03
1153
原创 Claude 的“性格”
“性格”训练是一个开放的研究领域,我们针对它的方法可能会随着时间的推移而发展。它提出了一些复杂的问题,例如人工智能模型是否应该具有独特而连贯的“性格”,还是应该更具可定制性,以及在决定人工智能模型应该和不应该具有哪些“性格”时我们承担什么责任。
2024-07-19 14:39:34
1150
原创 DALL·E3 模型介绍(4)----通过更好的图像题注改进图像生成
虽然 DALL-E 3 在提示跟随方面取得了重大进步,但它在物体放置和空间意识方面仍然存在困难。例如,使用“左边”、“下面”、“后面”等词语相当不可靠。这是因为我们的合成题注生成器也存在这个弱点:它在陈述对象位置方面不可靠,这在我们的下游模型中反映出来了。
2024-07-02 21:30:09
322
原创 DALL·E3 模型介绍(3)----通过更好的图像题注改进图像生成
在上一节中,我们使用 GPT-V 评估了 drawbench。我们注意到,对于某些类型的测试,GPT-V 在判断提示跟随方面的表现并不比随机表现更好。尤其是在涉及计算图像中物体数量的任务中,情况尤其如此。为了更好地覆盖drawbench的性能,我们使用上一节中描述的步骤提交了图像和标题以供人工评估。与我们的 GPT-V drawbench评估一样,我们仅比较 DALL-E 3、带有精炼模块的 Stable Diffusion XL 和 DALL-E 2。
2024-06-24 22:36:35
1056
原创 DALL·E3 模型介绍(2)----通过更好的图像题注改进图像生成
,通过对高度描述性的生成图像题注进行训练,可以显著提高文本到图像模型的提示跟随能力。现有的文本转图像模型很难理解详细的图像描述,而且经常会忽略文字或混淆提示的含义。我们假设这个问题源于训练数据集中嘈杂且不准确的图像题注。我们通过训练定制的图像题注生成器(image captioner)来解决这个问题,并使用它来重新捕捉训练数据集。
2024-06-17 22:20:52
941
原创 DALL·E3 模型介绍(1)
DALL·E 3 比我们以前的系统能够理解更多的细微差别和细节,让您可以轻松地将您的想法转化为极其精确的图像。现代文本转图像系统往往会忽略文字或描述,迫使用户接受机器的提示来完成。DALL·E 3 代表了我们在生成与您提供的文本完全一致的图像方面的能力的一次飞跃。
2024-06-11 20:51:12
666
原创 Open GPT 模型简单介绍
GPT的模型有GPT-4o,GPT-4 Turbo and GPT-4,GPT-3.5 Turbo,DALL·E,TTS,Whisper,Embeddings,Moderation,GPT base。GPT-4 的表现优于之前的大型语言模型,并且截至 2023 年,优于大多数最先进的系统(通常具有针对基准的训练或手工工程(hand-engineering))。GPT-4 是一个大型多模态模型(接受文本或图像输入并输出文本),由于其更广泛的常识和先进的推理能力,它可以比我们以前的任何模型更准确地解决难题。
2024-06-03 14:00:24
906
原创 GPT4o 基本介绍(下)
根据传统基准测试,GPT-4o 在文本、推理和智能编码方面达到了 GPT-4 Turbo 级别的性能,同时在多语言、音频和视觉功能上设置了新的高水位线。
2024-05-27 21:33:23
801
原创 GPT4o 基本介绍(上)
GPT-4o,我们的新旗舰模型可以通过音频、视觉和文本进行实时推理。GPT-4o(“o”代表“omni”)是迈向更自然的人机交互的一步——它可以将文本、音频、图像和视频的任意组合作为输入,并将文本、音频和图像的任意组合作为输出。他可以在最短232毫秒,平均320毫秒的时间,对音频做出响应,这与人类在对话中的响应时间相似。它在英语文本和代码上的性能与 GPT-4 Turbo 的性能一致,在非英语文本上的性能得到显着提高,同时 API 的速度也更快,成本降低了 50%。
2024-05-17 14:48:59
2204
原创 GPT-4 基本介绍(下)
我们一直在迭代 GPT-4,从最开始的训练起,我们通过对预训练的数据的选择和过滤、评估和专家的参与、模型安全性改进以及监控和执行,使得GPT-4更加安全,更一致。GPT-4 与以前的模型存在类似的风险,例如生成有害的建议、有错误的代码或不准确的信息。然而,GPT-4 的附加功能导致了新的风险面。为了了解这些风险的程度,我们聘请了来自AI 一致性风险、网络安全、生物风险、安全性和可靠性以及国际安全等领域的 50 多名专家来对模型进行对抗性测试。他们的发现使得我们能在高风险领域使用专业知识去评估模型。
2024-05-15 11:33:39
708
原创 GPT-4 基本介绍(上)
我们创建了 GPT-4,这是 OpenAI 在扩大深度学习的研究中的最新里程碑。GPT-4 是一个大型多模态模型(图像和文本作为输入,文本作为输出),虽然在许多现实场景中能力不如人类,但在各种专业和学术标准上表现出了人类的水平。例如,它通过了模拟律师考试,分数在考生中排名前 10%;相比之下,GPT-3.5 的得分在倒数 10% 左右。我们花了 6 个月的时间,利用对抗性测试项目和 ChatGPT 的经验总结,不断迭代校准 GPT-4。
2024-05-10 20:36:13
1416
原创 Open GPT:Sora(物理世界的模拟器)基本介绍
Sora 今天所拥有的能力表明,持续扩展的视频模型是开发现实和数字世界以及生活在里面的物体、动物和人的高性能模拟器的一条有前途的道路。
2024-04-26 19:35:35
919
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅