- 博客(47)
- 收藏
- 关注
原创 【翻译】OpenAI o3-mini系统卡 (2025年1月31日OpenAI发布) 【下】
我们在一系列放射性和核武器开发评估中对 OpenAI o3-mini 进行了评估,概述如下。我们注意到,我们在评估中没有使用或访问任何美国机密信息或受限数据,这限制了我们评估武器开发过程中某些步骤的能力。全面评估核武器开发的要素以及确保核和放射性材料安全的过程将需要与美国能源部合作。根据我们掌握的非机密信息,我们认为缓解后的 o3-mini 模型无法有效地协助放射性或核武器的开发,但再次注意,这种评估受到我们可以测试的内容的限制。
2025-02-05 00:04:20
1041
原创 【翻译】OpenAI o3-mini系统卡 (2025年1月31日OpenAI发布) 【上】
OpenAI o 模型系列采用大规模强化学习进行训练,使用思维链进行推理。这些先进的推理能力为提高我们模型的安全性和稳健性提供了新的途径。特别是,我们的模型可以通过审慎协调,在响应潜在不安全提示时根据上下文推理我们的安全政策。这使得 OpenAI o3-mini 在某些风险基准上的表现与最先进的水平相当,例如产生非法建议、选择刻板的回应和屈服于已知的越狱。在回答之前训练模型融入思维链有可能带来巨大的好处,同时也会增加因智力增强而产生的潜在风险。
2025-02-04 14:55:22
693
原创 【翻译】OpenAI Deep Research (2025年2月2日OpenAI发布)
在最近发布的评估“人类的最后考试”中,该模型在专家级问题上测试了广泛学科的人工智能,为深度研究提供支持的模型以 26.6% 的准确率创下了新高。该测试包括 3,000 多道多项选择题和简答题,涵盖语言学到火箭科学、古典文学到生态学等 100 多个学科。与 OpenAI o1 相比,进步最大的学科是化学、人文和社会科学以及数学。支持深度研究的模型展示了一种类似人类的方法,可以在必要时有效地寻找专业信息。
2025-02-03 23:10:41
1132
原创 【翻译】视频生成模型作为世界模拟器-24年2月文章
我们探索在视频数据上大规模训练生成模型。具体来说,我们在可变时长、分辨率和长宽比的视频和图像上联合训练文本条件扩散模型。我们利用一种在视频和图像潜在代码的时空块上运行的转换器架构。我们最大的模型 Sora 能够生成一分钟的高保真视频。我们的结果表明,扩展视频生成模型是构建物理世界通用模拟器的一条有希望的道路。本技术报告重点介绍 (1) 我们将所有类型的视觉数据转换为统一表示的方法,从而实现大规模生成模型的训练,以及 (2) 对 Sora 的功能和局限性进行定性评估。本报告未包含模型和实施细节。
2025-01-09 12:09:57
733
原创 【翻译】审慎对齐:推理使更安全的语言模型成为可能
随着大规模语言模型对安全关键领域的影响越来越大,确保它们可靠地遵守定义良好的原则仍然是一个基本挑战。本文提出慎思校准,一种新的范式,直接教模型安全规范,并训练它在回答之前明确地回忆和准确地推理规范。我们使用这种方法来对齐OpenAI的o系列模型,并实现了对OpenAI安全政策的高度精确遵守,而不需要人工编写思维链或答案。审慎对齐提升了帕累托边界,提高了对越狱的鲁棒性,同时降低了过度拒绝率,还提高了分布外泛化能力。通过对明确指定的策略进行推理,可以实现更可扩展、可信和可解释的对齐。
2025-01-01 22:43:04
1188
原创 【翻译】Direct Preference Optimization(DPO)你的语言模型实际上是一个奖励模型
虽然大规模无监督语言模型(Im)学习了广泛的世界知识和一些推理技能,但由于其训练的完全无监督性质,很难实现对其行为的精确控制。获得这种可控性的现有方法收集模型生成的相对质量的人工标记,并微调无监督LM以符合这些偏好,通常通过人工反馈的强化学习(RLHF)。然而,RLHF是一个复杂且往往不稳定的过程,首先拟合反映人类偏好的奖励模型,然后使用强化学习对大型无监督LM进行微调,以在不偏离原始模型太远的情况下最大化该估计奖励。
2025-01-01 19:14:20
1019
原创 【翻译】Sora 系统卡-12月9日
Sora 是 OpenAI 的视频生成模型,旨在接收文本、图像和视频输入并生成新视频作为输出。用户可以创建各种格式的分辨率高达 1080p(最长 20 秒)的视频,从文本生成新内容,或增强、重新混合和融合自己的资产。用户将能够探索精选和最新动态,这些动态展示了社区创作并为新想法提供灵感。Sora 以 DALL·E 和 GPT 模型的经验为基础,旨在为人们提供更多讲故事和创意表达的工具。Sora 是一种扩散模型,它从看起来像静态噪声的基础视频开始生成视频,并通过多步消除噪声逐渐对其进行转换。
2024-12-29 18:32:41
682
原创 【翻译】CLIP:连接文本和图片
我们引入了一个名为 CLIP 的神经网络,它可以有效地从自然语言监督中学习视觉概念。CLIP 可以应用于任何视觉分类基准,只需提供要识别的视觉类别的名称,类似于 GPT-2 和 GPT-3 的“零样本”功能。尽管深度学习彻底改变了计算机视觉,但当前的方法存在几个主要问题:典型的视觉数据集需要大量劳动力,创建成本高昂,同时只能教授一组狭窄的视觉概念;标准视觉模型只擅长一项任务,需要付出巨大努力才能适应新任务;在基准上表现良好的模型在压力测试中表现令人失望,使人们对整个计算机视觉深度学习方法产生怀疑。
2024-12-25 00:00:13
1019
原创 【翻译】大型 Transformer 模型推理优化
通过使用更少的 GPU 设备和更少的 GPU 内存来减少模型的内存占用;通过降低所需的 FLOPs 数量来降低所需的计算复杂度;减少推理延迟并加快运行速度。可以使用多种方法使推理在内存中更便宜或/和在时间上更快。应用各种并行性以在大量 GPU 上扩展模型。模型组件和数据的智能并行性使运行数万亿个参数的模型成为可能。内存卸载将暂时未使用的数据卸载到 CPU 并在以后需要时读回它们。这有助于减少内存使用,但会导致更高的延迟。智能批处理策略;
2024-12-22 20:25:14
1131
原创 使用 Microsoft Azure 架构完善的框架构建出色的解决方案
想象一下,您正在云上构建新系统或将现有系统迁移到云。如何让客户相信他们的数据是安全的?您的架构能否应对流量激增?您的架构能否处理一个或多个关键组件的故障?您是否以最有效的方式使用资源?Azure 架构完善的框架可帮助你设计、构建并持续改进安全、可靠且高效的应用程序。在本模块中,我们将向您介绍该框架,以及对于出色的Azure体系结构至关重要的支柱和原则。成本优化是确保您的组织花费的资金得到最大的利用。云服务将计算作为一种实用工具提供。云中的技术是在服务模型下提供的,可以按需使用。
2024-04-30 15:49:48
1922
原创 使用 Microsoft 成本管理 + 计费控制 Azure 支出和管理账单
在本模块中,你了解了 Azure 架构完善框架的成本优化支柱的五个关键原则。成本优化的工作负载不一定是低成本工作负载。存在重大权衡。战术方法是被动的,只能在短期内降低成本。为了实现长期的财务责任,您需要制定一个具有优先级、持续监控和可重复流程的战略,重点关注优化。当您确定业务需求的优先级以与技术需求保持一致时,您可以调整成本。但是,您应该预期在想要优化成本的领域需要进行一系列权衡,例如安全性、可扩展性、弹性和可操作性。
2024-04-29 15:02:43
1561
1
原创 [RFC5996 翻译二] IKEv2 互联网密钥交换协议版本2
rfc5996 (ietf.org)接上篇blog(59条消息) [RFC5996 翻译一] IKEv2 互联网密钥交换协议版本2_羊羊洒洒_Blog的博客-优快云博客3.15.配置负载 Configuration Payload配置负载,在本文档中表示为 CP,用于在 IKE 对等体之间交换配置信息。交换是为了让 IRAC 从 IRAS 请求一个内部 IP 地址,并交换其他信息,如果 IRAC 直接连接到 LAN,则可以使用动态主机配置协议 (DHCP) 获取此类信息。配置负载定义.
2022-03-21 23:16:45
1766
原创 [Azure技术篇] Azure ExpressRoute (1)
[Azure技术篇] Azure ExpressRoute ER/Azure VPN/Virtual WAN的简单对比介绍;ER基本功能和部署模块介绍;ER对等连接介绍;ER高可用架构简述 (下一篇详述)
2022-03-19 23:25:54
1028
原创 [RFC2616-HTTP/1.1 超文本传输协议](翻译)[Part 1]
原文:RFC 2616 - Hypertext Transfer Protocol -- HTTP/1.1 (ietf.org)(因本篇RFC较长,将其分为几篇文章进行翻译)超文本传输协议——HTTP/1.1超文本传输协议 (HTTP) 是分布式、协作、超媒体信息系统的应用层协议。它是一种通用的、无状态的协议,通过扩展其请求方法、错误代码和标头 [47],可用于超文本之外的许多任务,例如名称服务器和分布式对象管理系统。 HTTP 的一个特性是数据表示的类型化和协商,允许独立于正在传输的数
2022-02-15 23:23:59
4055
1
原创 [RFC6023] 互联网密钥交换版本 2 (IKEv2) 安全协会 (SA) 的Childless 初始化 (翻译)
rfc6023 (ietf.org)A Childless Initiation of the Internet Key Exchange Version 2 (IKEv2) Security Association (SA)本文档描述了 Internet 密钥交换版本 2 (IKEv2) 协议的扩展,该协议允许在不生成子 SA 的情况下创建和验证 IKEv2 安全关联 (SA)。1. 介绍[RFC5996] 中规定的 IKEv2 要求 IKE_AUTH 交换尝试与 IKEv2 SA 一
2021-12-11 17:56:10
6806
原创 [RFC5996 翻译一] IKEv2 互联网密钥交换协议版本2
rfc5996 (ietf.org)本文档介绍了 Internet 密钥交换 (IKE) 协议的第 2 版。 IKE 是 IPsec 的一个组件,用于执行相互身份验证以及建立和维护安全关联 (SA)。本文档替换并更新了 RFC 4306,并包含了 RFC 4718 中的所有说明。目录 1. 介绍 1.1.使用场景 1.1.1.隧道模式下的安全网关到安全网关 1.1.2.端点到端点传输模式 1.1.3.隧道模...
2021-12-11 10:40:15
2929
2
原创 【RFC3449 网络路径不对称对 TCP 性能的影响】(翻译)
原文https://datatracker.ietf.org/doc/html/rfc3449概述本文档描述了由于非对称效应而产生的 TCP 性能问题。由于不同的根本原因,这些问题出现在几个接入网络中,包括带宽不对称网络和分组无线b子网。然而,这两种情况下 TCP 性能的最终结果是相同的:由于从接收器到发送器的 ACK 反馈的不完善和可变性,性能通常会显着下降。该文件详细介绍了对这些影响的几种缓解措施,这些措施已在文献中提出或评估,或者目前已部署在网络中。这些解决方案结合使用本地链路层技术、..
2021-07-01 23:31:17
1158
1
原创 【RFC6191 使用 TCP 时间戳减少 TIME-WAIT 状态】(翻译)
本文档描述了一种用于处理传入 SYN 段的算法,当传入 SYN 段中存在 TCP 时间戳选项时,该算法允许任何两个 TCP 端点之间的更高连接建立速率。本文档仅修改了对 TIME-WAIT 状态下的连接接收的 SYN 段的处理;所有其他状态的处理没有变化。目录 1. 简介 2. 改进的对传入连接请求的处理 3. 与各种时间戳生成算法的交互 4. 与各种 ISN 生成算法的交互 5. 安全考虑 6. 致谢 7. 参考文献 7.1.规范参考 ...
2021-07-01 14:26:51
527
原创 【RFC7323 高性能的TCP扩展】(翻译)
https://datatracker.ietf.org/doc/html/rfc7323 高性能的 TCP 扩展本文档指定了一组 TCP 扩展,以提高具有大带宽乘以延迟的积的路径的性能,并在非常高速的路径上提供可靠的操作。它定义了 TCP Window Scale (WS) 选项和 TCP Timestamps (TS) 选项及其语义。 Window Scale 选项用于支持更大的接收窗口,而 Timestamps 选项可用于至少两种不同的机制,防止包装序列 (PAWS) 和往返时间测量 (RTTM)
2021-06-30 20:52:01
1018
1
原创 【RFC5783 RFC系列中的拥塞控制】(翻译)
原文https://datatracker.ietf.org/doc/html/rfc5783Congestion Control in the RFC SeriesRFC系列中的拥塞控制本文档是 IRTF 的 Internet 拥塞控制研究组 (ICCRG) 于 2008 年 10 月截取的信息快照。它提供了对 RFC 系列文档中描述的拥塞控制主题的调查。这不会修改或更新所讨论的 RFC 文档的规范或状态。它可以作为研究组未来工作的参考或起点,特别是在指出当前 IETF 标准中的差距或开放问题时...
2021-06-30 12:49:48
702
原创 【RFC2818 基于 TLS 的 HTTP】(翻译)
原文https://datatracker.ietf.org/doc/html/rfc2818HTTP Over TLS 基于TLS的HTTP本文描述了如何使用 TLS 来保护 Internet 上的 HTTP 连接。 当前的做法是通过 SSL(TLS 的前身)对 HTTP 进行分层,通过使用不同的服务器端口来区分安全流量和不安全流量。 本文档记录了使用 TLS 的练习。 配套文档描述了一种在与普通 HTTP [RFC2817] 相同的端口上使用HTTP/TLS 的方法。目录 1. 简...
2021-06-29 23:43:35
568
原创 【RFC2663 IP 网络地址转换器 (NAT) 术语和注意事项】(翻译)
原文https://datatracker.ietf.org/doc/html/rfc2663IP Network Address Translator (NAT) Terminology and ConsiderationsIP 网络地址转换器 (NAT) 术语和注意事项前言本文档背后的动机是明确与网络地址转换器结合使用的术语。术语“网络地址转换器”在不同的上下文中有不同的含义。本文档的目的是定义各种类型的 NAT 并标准化所用术语的含义。网络地址转换是一种将 IP 地址从一个领域映射...
2021-06-29 23:24:41
1872
1
原创 【RFC5382 TCP 的 NAT 行为要求】(翻译)
原文https://datatracker.ietf.org/doc/html/rfc5382NAT Behavioral Requirements for TCPTCP 的 NAT 行为要求本文档为处理 TCP 的 NAT 定义了一组要求,这些要求将允许许多应用程序(例如对等应用程序和在线游戏)一致地工作。开发满足这组要求的 NAT 将大大增加这些应用程序正常运行的可能性。目录 1. 适用性声明 2. 介绍 3. 术语 4. TCP 连接初始化 4.1. ...
2021-06-29 09:34:42
408
原创 【RFC3522 TCP 的 Eifel 检测算法】(翻译)
原文https://datatracker.ietf.org/doc/html/rfc3522The Eifel Detection Algorithm for TCP TCP的Eifel检测算法概述Eifel 检测算法允许 TCP 发送方检测其是否已进入不必要的丢失恢复后验。它要求为连接启用 RFC 1323 中定义的 TCP 时间戳选项。 Eifel 检测算法利用了 TCP Timestamps 选项消除了 TCP 中的重传歧义这一事实。根据在丢失恢复期间到达的第一个可接受 ACK 的时间戳..
2021-06-27 19:01:01
457
原创 【RFC6582 TCP快速恢复算法的NewReno修改】(翻译)
原文https://datatracker.ietf.org/doc/html/rfc6582 The NewReno Modification to TCP's Fast Recovery AlgorithmTCP快速恢复算法的NewReno修改RFC 5681 记录了以下四种相互交织的 TCP 拥塞控制算法:慢启动、拥塞避免、快速重传和快速恢复。 RFC 5681 明确允许对这些算法进行某些修改,包括使用 TCP 选择性确认 (SACK) 选项 (RFC 2883) 的修改,以及在没有SACK...
2021-06-27 17:51:19
776
1
原创 【RFC2780 互联网协议和相关头部中值的 IANA 分配指南】(翻译)
原文https://datatracker.ietf.org/doc/html/rfc2780IANA Allocation Guidelines For Values In the Internet Protocol and Related Headers 互联网协议和相关头部中值的 IANA 分配指南本文为 IANA 为 IPv4、IPv6、ICMP、UDP 和 TCP 协议头部中的字段分配参数提供了指导。1. 简介多年来,互联网号码分配机构 (IANA) (www.iana.org)...
2021-06-27 14:53:12
515
原创 【RFC3042 使用有限传输增强 TCP 的丢失恢复】(翻译)
原文https://datatracker.ietf.org/doc/html/rfc3042Enhancing TCP's Loss Recovery Using Limited Transmit使用有限传输增强 TCP 的丢失恢复概述该文档提出了一种新的传输控制协议 (TCP) 机制,当连接的拥塞窗口较小时,或者在单个传输窗口中丢失大量数据段时,可以使用该机制更有效地恢复丢失的数据段。 “有限传输”算法要求发送一个新的数据段,以响应到达发送方的前两个重复确认中的每一个。传输这些段会增加 ...
2021-06-27 14:29:51
288
原创 【RFC2018 TCP选择确认选项】(翻译)
原文https://datatracker.ietf.org/doc/html/rfc2018TCP Selective Acknowledgement Options TCP选择确认选项概述当多个数据包从一个数据窗口丢失时,TCP 的性能可能会很差。由于累积确认提供的信息有限,TCP 发送方在每个往返时间内只能了解一个丢失的数据包。激进的发送方可以选择提前重新传输数据包,但可能已经成功接收到此类重新传输的数据段。选择性确认 (SACK) 机制与选择性重复重传策略相结合,可以帮助克服这些限制..
2021-06-27 11:24:21
1084
原创 【RFC7413 TCP快速打开】(翻译)
原文https://datatracker.ietf.org/doc/html/rfc7413TCP Fast Open TCP快速打开概述本文档描述了一种称为 TCP Fast Open (TFO) 的实验性 TCP 机制。 TFO 允许在 SYN 和 SYN-ACK 数据包中携带数据并在初始连接握手期间由接收端消耗,并且与标准 TCP 相比,最多可以节省一个完整的往返时间 (RTT),后者需要三次握手(3WHS)完成之前可以交换数据。 然而,TFO 偏离了标准的 TCP 语义,因为 SYN ..
2021-06-27 10:53:25
512
原创 【RFC3465 具有适当字节计数 (ABC) 的 TCP 拥塞控制】(翻译)
原文https://datatracker.ietf.org/doc/html/rfc3465 TCP Congestion Control with Appropriate Byte Counting (ABC) 具有适当字节计数 (ABC) 的 TCP 拥塞控制概述本文档对 TCP 增加其拥塞窗口的方式提出了一个小的修改。与为每个到达的确认增加一个恒定数量的拥塞窗口的传统方法不同,该文档建议基于每个 ACK 覆盖的先前未确认字节数的增加。此更改提高了 TCP 的性能,并关闭了 TCP ..
2021-06-27 00:10:29
310
1
原创 【RFC3390 增加TCP初始窗口】(翻译)
原文https://datatracker.ietf.org/doc/html/rfc3390Increasing TCP's Initial Window 增加TCP初始窗口本文档为 TCP 指定了一个可选标准,将允许的初始窗口从一个或两个段增加到大约 4K 字节,以取代 RFC 2414。它讨论了更高初始窗口的优缺点,并包括对实验和模拟的讨论表明较高的初始窗口不会导致拥塞崩溃。最后,本文提供了有关实施问题的指导。1.TCP修改本文档废弃 [RFC2414] 并更新 [RFC2581],..
2021-06-27 00:02:16
591
原创 【RFC6298 计算TCP重传计时器】(翻译)
原文https://datatracker.ietf.org/doc/html/rfc6298 Computing TCP's Retransmission Timer计算TCP重传计时器概述本文档定义了传输控制协议 (TCP) 发送方用于计算和管理其重传计时器的标准算法。 它扩展了 RFC 1122 第 4.2.3.1 节中的讨论,并将支持算法的要求从 SHOULD 升级为 MUST。 本文档废弃了 RFC 2988。1. 简介传输控制协议 (TCP) [Pos81] 使用重传计...
2021-06-26 19:39:19
901
原创 [RFC6691 TCP 选项和最大段大小 (MSS)】(翻译)
原文https://datatracker.ietf.org/doc/html/rfc6691TCP Options and Maximum Segment Size (MSS) TCP 选项和最大段大小 (MSS)概述本文讨论了与 TCP 最大段大小 (MSS) 选项一起使用的值,并更新了 RFC 879 和 RFC 2385。1. 简介在使用 IP 和 TCP 选项时,对于 TCP MSS 选项使用什么值存在一些混淆。 RFC 879 [RFC879] 指出: M...
2021-06-26 19:19:20
489
原创 【RFC7414 传输控制协议 (TCP) 规范文档的路线图】(翻译)
原文rfc7414 (ietf.org) A Roadmap for Transmission Control Protocol (TCP) Specification Documents 传输控制协议 (TCP) 规范文档的路线图概述本文档包含与 Internet 的传输控制协议 (TCP) 相关的征求意见 (RFC) 文档的路线图。 该路线图提供了定义 TCP 和各种 TCP 扩展的文档的简要摘要,这些文档在 RFC 系列中积累。 这可以作为 TCP 实施者和其他需要包含在 TCP 相...
2021-06-26 19:00:02
1104
原创 【RFC5681 TCP拥塞控制】(翻译)
原文rfc5681 (ietf.org)TCP Congestion Control TCP拥塞控制概述本文档定义了 TCP 的四种相互交织的拥塞控制算法:慢启动、拥塞避免、快速重传和快速恢复。此外,该文档还规定了 TCP 在相对较长的空闲期后应如何开始传输,并讨论了各种确认生成方法。本文档废弃了 RFC2581。目录 1. 简介 2. 定义 3. 拥塞控制算法 3.1. 慢启动和拥塞避免 3.2. 快速重传/快速恢复 4. 其他注意事项...
2021-06-25 22:42:01
1877
1
原创 【RFC7657 差分服务和实时通信】(翻译)
原文rfc7657 (ietf.org)Differentiated Services (Diffserv) and Real-Time Communication差分服务 (Diffserv) 和实时通信概述本文描述了差分服务 (Diffserv) 网络服务质量 (QoS) 功能和实时网络通信之间的交互,包括基于实时传输协议 (RTP) 的通信。 差分服务基于网络节点对 IP 头部标有不同的差分服务代码点 (DSCP) 的数据包应用不同的转发处理。WebRTC 应用程序以及一些会议应用程...
2021-06-25 18:36:04
866
原创 【RFC5865 容量允许的流量差分服务代码点 (DSCP)】(翻译)
原文rfc5865 (ietf.org)A Differentiated Services Code Point (DSCP) for Capacity-Admitted Traffic 容量允许流量的差异化服务代码点 (DSCP)概述本文档要求互联网号码分配机构 (IANA) 为一类实时流量提供一个差分服务代码点 (DSCP)。该流量类别符合加速转发每跳行为。该流量也由网络使用涉及身份验证、授权和容量许可的呼叫许可控制 (CAC) 过程许可。这与符合加速转发每跳行为但不受容量许可或非常粗略容量..
2021-06-24 22:42:37
544
2
原创 [RFC2386]基于 QoS 的 Internet 路由框架 (翻译)
原文rfc2386 (ietf.org)A Framework for QoS-based Routing in the Internet基于 QoS 的 Internet 路由框架概述本文为 Internet 社区提供信息。它没有指定任何类型的 Internet 标准。在 Internet 中基于 QoS 的服务产品的演进过程中,基于 QoS 的路由被认为是缺失的部分。本文档描述了一些基于 QoS 的路由问题和要求,并提出了 Internet 中基于 QoS 的路由的框架。该框架基于...
2021-06-23 23:05:55
703
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人