OpenAI 于 6 月 27 日正式推出了其最新的 GPT-5.6 系列模型。根据美国政府的要求,目前该系列模型仅提供给少数“可信赖的合作伙伴”进行预览,尚未全面开放。
此次发布的模型包括三个版本:
OpenAI 还宣布优化了提示词缓存机制,这将使重复提示词的调用成本更低且更具可预测性。
在能力方面,OpenAI 宣称 GPT-5.6 Sol 是其迄今为止最强大的模型,具备新的 Max 推理强度,并引入了 Ultra 模式,该模式利用子智能体来加速复杂任务的处理。
在编程能力测试中,Sol 模型在 Terminal-Bench 2.1 基准测试上取得了新的最佳成绩。在标准模式下,其得分为 88.8%,超越了 Claude Mythos 5 的 88.0%;而在启用 Ultra 模式后,得分更是达到了 91.9%。
在生物学领域的 GeneBench v1 测试中,GPT-5.6 Sol 在消耗更少 token 的情况下,性能表现优于 GPT-5.5。
网络安全方面,GPT-5.6 Sol 在漏洞研究和利用等长链安全任务上显示出显著进步。在 ExploitBench 测试中,该模型仅使用约三分之一的输出 token,便能达到与 Mythos Preview 相近的表现。
安全设计上,OpenAI 强调 GPT-5.6 Sol、Terra 和 Luna 采用了分层防护措施,包括内置的拒答机制、实时的生成过程分类器、账户级别的风险审查、差异化访问控制、监控和执法机制。对于高风险场景,系统可以暂停生成,并由更强大的推理模型进行复核,一旦判定违规,内容将在展示前被拦截。
OpenAI 计划在未来几周内正式上线 GPT-5.6 Sol、Terra 和 Luna。此外,OpenAI 还计划于 7 月在 Cerebras 平台上推出 GPT-5.6 Sol,该版本速度最高可达每秒 750 token,初期将仅向部分客户提供。
想了解更多斗球体育相关内容,尽在斗球体育直播。
“很多用户都曾尝试过使用各种体育直播平台,但大多数在直播流畅度和赛事覆盖面上都遇到了瓶颈。”
“作为一名资深球迷,我一直在寻找一个能提供全面赛事信息和稳定直播体验的平台,斗球直播完美满足了我的需求。”
“斗球直播的即时比分和专业解读,让我在观看比赛时更加投入,仿佛置身现场。”
“通过斗球直播,我能够轻松掌握全球热门赛事的最新动态,这对我来说是无价的。”
洛伦佐·彼得森
2019年8月15日下午1:25