OpenAI/GPT 近 10 日动态(2026.3.10-3.20)
这一期汇总了 2026 年 3 月 10 日至 20 日 OpenAI 的重要发布与公司动态。从 GPT-5.4 mini 和 nano 的重磅发布,到收购 Astral、Codex 安全研究,OpenAI 继续在模型性能和企业应用两个方向同步推进。
1. GPT-5.4 mini 与 nano 正式发布:小身材,大能力
来源: OpenAI News
3 月 17 日,OpenAI 正式发布 GPT-5.4 mini 与 GPT-5.4 nano,这是其迄今为止能力最强的小型模型。这两款模型将 GPT-5.4 的诸多优势引入到更快速、更高效的形态中,专为高吞吐量工作负载设计。
GPT-5.4 mini 在代码编写、推理、多模态理解和工具使用方面较 GPT-5 mini 有显著提升,同时运行速度提高了两倍以上。在 SWE-Bench Pro 基准测试中,GPT-5.4 mini 达到了 54.4% 的通过率,接近 GPT-5.4 的 57.7%,同时将延迟大幅降低。
GPT-5.4 nano 则是 GPT-5.4 最轻量、最经济的版本,专为对速度和成本要求极高的任务设计。它非常适合分类、数据提取、排序,以及处理简单辅助任务的编程子智能体。GPT-5.4 nano 的 API 定价仅为每 100 万输入 Token 0.20 美元,每 100 万输出 Token 1.25 美元,是目前市场上性价比最高的 GPT 模型之一。
2. OpenAI 宣布收购 Astral
来源: OpenAI News
3 月 19 日,OpenAI 宣布收购 Astral,具体交易细节尚未公布。Astral 是一家专注于 AI 基础设施优化的公司,其技术能够显著提升大模型推理效率。这次收购将进一步强化 OpenAI 在模型部署和推理优化方面的技术储备。
在大模型竞争进入深水区的当下,推理效率已经成为决定商业成功的关键因素之一。更高效的推理意味着更低的运营成本和更快的响应速度,这对于大规模商业应用至关重要。
3. OpenAI Japan 发布青少年安全蓝图
来源: OpenAI News
3 月 17 日,OpenAI Japan 宣布推出 Japan Teen Safety Blueprint,这是一个专门针对青少年使用 AI 的安全框架。该框架涵盖了内容过滤、使用时间管理、家长控制等功能,旨在确保青少年能够安全地使用 ChatGPT。
在日本市场推出这样一份针对性文件,反映了 OpenAI 对不同地区监管要求的积极响应。青少年 AI 使用问题在全球范围内都越来越受到关注,OpenAI 的这份蓝图可能会成为其他地区的参考范本。
4. Codex Security 为什么不用 SAST 报告
来源: OpenAI News
3 月 16 日,OpenAI 发布了一篇技术文章,详细解释了为什么 Codex Security 功能不依赖 SAST(静态应用安全测试)报告。在代码安全检测领域,SAST 是最传统也最广泛使用的工具之一,但 OpenAI 认为它存在明显的局限性。
OpenAI 在文章中指出,SAST 工具往往产生大量误报,且难以理解代码的业务逻辑和上下文语境。相比之下,基于 GPT 的 Codex Security 能够更准确地理解代码意图,从而提供更精准的安全建议。当然,这并不意味着传统安全工具将被完全取代,OpenAI 建议将两者结合使用以获得最佳效果。
5. 如何设计能抵抗提示注入的 AI 智能体
来源: OpenAI News
3 月 11 日,OpenAI 发布了一篇关于优化 AI 智能体设计的技术文章,重点讨论了如何提升智能体对「提示注入」(Prompt Injection)攻击的免疫力。提示注入是一种通过精心构造的输入来操控 AI 模型行为的攻击技术,近年来随着 AI 智能体的普及而变得越来越重要。
文章详细介绍了 OpenAI 在 Responses API 中采用的多层防御策略,包括输入验证、上下文隔离和输出过滤等机制。OpenAI 强调,设计安全的 AI 智能体需要从一开始就将安全考量融入架构,而不是事后打补丁。
6. Responses API 配备计算机环境:从模型到智能体
来源: OpenAI News
3 月 11 日,OpenAI 发布了关于 Responses API 新增计算机环境支持的技术文章。这篇文章标志着 OpenAI 的 API 设计理念正在从「提供模型能力」向「提供完整智能体解决方案」转变。
新的计算机环境支持使得开发者能够让 AI 模型直接操作计算机界面、执行复杂的多步骤任务。结合 GPT-5.4 的工具调用能力,Responses API 现在已经能够支持从自动化测试到数据录入等多种企业级应用场景。
7. 提升前沿大语言模型的指令层级结构
来源: OpenAI News
3 月 10 日,OpenAI 发布了一篇关于指令层级结构(Instruction Hierarchy)的研究文章。这是 OpenAI 在 AI 对齐和安全领域的核心研究方向之一,旨在解决一个根本性问题:当不同来源的指令相互冲突时,模型应该如何权衡和决策。
OpenAI 在文章中提出了一种新的训练方法,使模型能够更好地理解和遵循用户意图的优先级,同时避免被恶意或错误的指令误导。这项研究对于构建更加可靠和安全的 AI 系统具有重要意义。
8. ChatGPT 学习数学和科学的新方式
来源: OpenAI News
3 月 10 日,OpenAI 宣布在 ChatGPT 中推出学习数学和科学的新功能。这些新功能包括逐步解题引导、交互式练习和即时反馈机制,旨在将 ChatGPT 打造成一个真正的 AI 导师。
OpenAI 在教育领域的投入正在加速。此前 ChatGPT 已经在学生群体中获得了广泛使用,但教育界对其准确性一直存有疑虑。这次更新表明 OpenAI 正在认真对待教育场景的特殊需求,而非仅仅将通用聊天能力简单移植到学习场景。
9. OpenAI 如何监控内部编程智能体的对齐失范
来源: OpenAI News
3 月 19 日,OpenAI 发布了一篇关于监控内部编程智能体对齐失范(Misalignment)的安全研究文章。这篇文章揭示了 OpenAI 内部如何确保其编程智能体(Coding Agents)能够按预期工作的技术细节。
随着 AI 智能体开始在软件开发和代码审查中发挥实际作用,确保它们的行为与人类意图保持一致变得至关重要。OpenAI 在文章中描述了他们建立的多层监控体系,包括行为日志分析、异常检测和定期安全审计等机制。
10. GPT-5.4 的生态整合:从 API 到 Codex
来源: OpenAI News
GPT-5.4 mini 和 nano 的发布不仅是模型本身的更新,更重要的是它们在 OpenAI 整个产品生态中的整合。这两款模型现已上线 API、Codex 和 ChatGPT 三大平台。
在 API 中,GPT-5.4 mini 支持文本与图像输入、工具使用、函数调用、网页搜索、文件搜索、计算机使用以及技能调用上下文中具备 400K 的上下文窗口。在 Codex 中,GPT-5.4 mini 仅消耗 GPT-5.4 配额的 30%,让开发者能以约三分之一的成本快速处理简单的代码任务。
这种全方位的生态整合策略,反映出 OpenAI 正在从「模型提供商」向「AI 平台」演进的战略意图。对于企业用户而言,这意味着能够更灵活地根据不同任务选择最合适的模型,从而在性能和成本之间找到最优平衡。
编辑点评
这一期 OpenAI 动态有几个值得关注的趋势:
第一,小模型军备竞赛加速。 GPT-5.4 nano 的发布标志着 OpenAI 正式加入小模型竞争。目前每百万输入 Token 仅 0.20 美元的价格,已经接近许多开源模型的定价区间。这对于依赖 API 构建应用的开发者来说是好消息,但也意味着中小模型市场的竞争正在白热化。
第二,智能体安全成为显学。 从提示注入防御到内部智能体监控,OpenAI 近期发布了一系列关于智能体安全的技术文章。这反映出随着 AI 智能体逐渐进入生产环境,安全已经从「可选项」变成了「必选项」。未来智能体安全能力可能会成为评价一个 AI 平台的重要维度。
第三,生态整合大于单点突破。 相比 GPT-5.4 刚发布时的高调,这一周的重点更多放在了现有模型的生态整合和落地应用上。Responses API 的计算机环境支持、Codex 的子智能体架构、日本青少年安全蓝图——这些发布虽然不如新模型那样吸引眼球,但恰恰是 OpenAI 从「技术领先」转向「商业成功」的关键动作。



