OpenAI 于 6 月 27 日正式公布了 GPT-5.6 系列模型。根据美国政府的要求,该系列模型目前仅对部分“可信合作伙伴”开放预览。
此次发布的 GPT-5.6 系列包含三个不同档次的模型:
OpenAI 还提到,对提示词缓存机制进行了优化,以降低重复提示词的调用成本并提高可预测性。
在性能方面,OpenAI 将 GPT-5.6 Sol 定位为其最强大的模型,引入了新的 Max 推理强度,并具备通过子智能体加速复杂任务的 Ultra 模式。在编程能力测试中,Sol 在 Terminal-Bench 2.1 基准测试上取得了 88.8% 的标准模式得分,超越了 Claude Mythos 5 的 88.0%,而在 Ultra 模式下,得分更是达到了 91.9%。
在生物学领域的 GeneBench v1 测试中,GPT-5.6 模型在消耗更少 Token 的情况下,性能表现优于 GPT-5.5。
网络安全方面,GPT-5.6 Sol 在漏洞研究和利用等长链路安全任务上表现出显著提升。在 ExploitBench 测试中,它仅用约三分之一的输出 Token 量就能达到与 Mythos Preview 相似的效果。
在安全设计上,GPT-5.6 Sol、Terra 和 Luna 采用了多层防护措施,包括内置的拒答机制、生成过程中的实时分类器、账户级别的风险审查、差异化访问控制、监控以及执法机制。对于高风险场景,系统能够暂停生成并由更强大的推理模型进行复核,若判定为违规,内容将在展示前被拦截。
OpenAI 计划在未来几周内正式向公众开放 GPT-5.6 Sol、Terra 和 Luna。此外,OpenAI 还计划在 7 月份在 Cerebras 平台上推出 GPT-5.6 Sol,其处理速度最高可达每秒 750 Token,初期将仅向部分客户提供。
蜘蛛直播专注蜘蛛直播官网,为用户提供专业可靠的体验。
“我们致力于为全球体育爱好者提供最流畅、最全面的赛事直播与深度内容体验,让您随时随地掌握赛场动态。”
“告别卡顿,享受稳定高效的赛事直播,满足您对各类体育赛事的观看需求。”
“实时比分更新,更有深度数据分析,助您洞悉比赛脉搏,玩转体育竞猜。”
“加入我们的互动社区,与全球球迷交流,聆听专家解读,增强观赛的乐趣与深度。”
Lorenzo Peterson
15th August, 2019 at 01:25 pm