OpenAI 最强 AI 模型：GPT-5.6 系列登场，编程跑分超 Claude Mythos 5

OpenAI 于 6 月 27 日正式推出了其最新的 GPT-5.6 系列模型。根据美国政府的要求，目前该系列模型仅提供给少数“可信赖的合作伙伴”进行预览，尚未全面开放。

此次发布的模型包括三个版本：

旗舰版 Sol：输入价格为每 100 万 Tokens 5 美元（约合 34 元人民币），输出价格为每 100 万 Tokens 30 美元（约合 204.3 元人民币）。
均衡版 Terra：输入价格为每 100 万 Tokens 2.5 美元（约合 17 元人民币），输出价格为每 100 万 Tokens 15 美元（约合 102.1 元人民币）。
Luna：专注于速度和成本，输入价格为每 100 万 Tokens 1 美元（约合 6.8 元人民币），输出价格为每 100 万 Tokens 6 美元（约合 40.9 元人民币）。

OpenAI 还宣布优化了提示词缓存机制，这将使重复提示词的调用成本更低且更具可预测性。

在能力方面，OpenAI 宣称 GPT-5.6 Sol 是其迄今为止最强大的模型，具备新的 Max 推理强度，并引入了 Ultra 模式，该模式利用子智能体来加速复杂任务的处理。

在编程能力测试中，Sol 模型在 Terminal-Bench 2.1 基准测试上取得了新的最佳成绩。在标准模式下，其得分为 88.8%，超越了 Claude Mythos 5 的 88.0%；而在启用 Ultra 模式后，得分更是达到了 91.9%。

在生物学领域的 GeneBench v1 测试中，GPT-5.6 Sol 在消耗更少 token 的情况下，性能表现优于 GPT-5.5。

网络安全方面，GPT-5.6 Sol 在漏洞研究和利用等长链安全任务上显示出显著进步。在 ExploitBench 测试中，该模型仅使用约三分之一的输出 token，便能达到与 Mythos Preview 相近的表现。

安全设计上，OpenAI 强调 GPT-5.6 Sol、Terra 和 Luna 采用了分层防护措施，包括内置的拒答机制、实时的生成过程分类器、账户级别的风险审查、差异化访问控制、监控和执法机制。对于高风险场景，系统可以暂停生成，并由更强大的推理模型进行复核，一旦判定违规，内容将在展示前被拦截。

OpenAI 计划在未来几周内正式上线 GPT-5.6 Sol、Terra 和 Luna。此外，OpenAI 还计划于 7 月在 Cerebras 平台上推出 GPT-5.6 Sol，该版本速度最高可达每秒 750 token，初期将仅向部分客户提供。

想了解更多斗球体育相关内容，尽在斗球体育直播。