請求 GPT 圖像 2.0 創建 opus 4.7 與 gpt 5.5 的基準表。


那個圖像模型變得非常厲害。
GPT-5.5 贏得了頭條排行榜。但仔細看看。
OSWorld 78.7 比 78.0。GDPval 84.9 比 80.3。Toolathlon 55.6 比 54.6 (超過 5.4,不是 Opus)。
Opus 仍然擁有 SWE-Bench Pro、MCP Atlas、GPQA Diamond、HLE no-tools。
OpenAI 獲得全能冠軍。Anthropic 保持編碼冠軍。紙面上如此。
查看原文
post-image
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言