📢 GM!Gate 广场|4/5 热议:#假期持币指南
🌿 踏青还是盯盘?#假期持币指南 带你过个“松弛感”长假!
春光正好,你是选择在山间深呼吸,还是在 K 线里找时机?在这个清明假期,晒出你的持币态度,做个精神饱满的交易员!
🎁 分享生活/交易感悟,抽 5 位锦鲤瓜分 $1,000 仓位体验券!
💬 茶余饭后聊聊:
1️⃣ 休假心态: 你是“关掉通知、彻底失联”派,还是“每 30 分钟必刷行情”派?
2️⃣ 懒人秘籍: 假期不想盯盘?分享你的“挂机”策略(定投/网格/理财)。
3️⃣ 四月展望: 假期过后,你最看好哪个币种“春暖花开”?
分享你的假期姿态 👉 https://www.gate.com/post
📅 4/4 15:00 - 4/6 18:00 (UTC+8)
GPT-5.4 Pro 在 MESNA 挪威测试中智商飙升至 150,OpenAI 打破了自己的纪录
将
设为 CryptoSlate 首选
OpenAI 最新的 GPT-5.4 Pro 模型现已取得比 99.96% 的所有人类更高的 IQ 分数,这为市场释放了一个全新的信号:AI 能力的提升开始超过了通常产品周期带来的噪声。
OpenAI 的 GPT-5.4 Pro 在进入又一个以宏观为主导的周之际触及 150 分的公开 IQ 基准
TrackingAI 的公开排行榜现在将 OpenAI GPT-5.4 Pro 的 IQ 分数置于 150,该成绩较 OpenAI 去年在 Mensa Norway 测试中由 o3 取得的 136 分出现了显著跃升。
这一跃升出现在这样的时点:市场注意力已收敛到伊朗、能源、劳动力偏弱以及下一次通胀数据公布。于是,本周接下来要回答的问题变得不同:机器智能的复利究竟会以多快的速度在叠加,而这种加速度又将在何时与经济层面的仓位布局发生重叠?
为什么这很重要:在广为理解的基准上从 136 提升到 150,会把一种复杂的能力跃迁压缩成一个简单信号。对企业而言,这个信号会直接影响围绕自动化、软件预算以及人员编制规划的决策。对市场而言,它让另一项变量加入到了利率、通胀和增长预期之中。
OpenAI 将 GPT-5.4 作为其面向专业工作的最强大、最高效的前沿模型,并在编码、工具使用以及计算机使用方面表现更强,且上下文窗口最高可达 1,000,000 tokens。在同一发布中,OpenAI 表示 GPT-5.4 在 GDPval 上达到了新的最先进水平,并在 OSWorld-Verified 上超过了人类表现。
这些基准不同于公开 IQ 测试,但其发展方向是对齐的。能力在不同的测量体系中都在上升,而这种上升的速度已经快到足以影响预算编制、招聘计划、工作流设计以及软件支出。
在公开 IQ 风格基准上取得 150 分,会把更广泛的能力跃迁压缩为一个单一、可携带的信号。即便在方法学尚未被讨论之前,这个数字也容易被理解。
更早的 o3 Mensa 结果确立了该基准以及其边界。GPT-4.1 的百万 tokens 上下文窗口展示了 OpenAI 如何把模型效用扩展到更长视野的代码与文档任务;而我们对 OpenAI 扩大资本回路的分析则把模型进展与硬件扩张、融资循环以及基础设施需求联系在了一起。
综合来看,这些进展把最新的 IQ 分数置于更广泛的商业与经济语境之中。在公开基准上从 136 到 150 的变化本身就令人瞩目。在 OpenAI 进一步深入工具使用、计算机使用、企业级生产力以及资本密集型基础设施的同时,从 136 到 150 的跃升还意味着更深层的影响。
公开 IQ 基准有限,但能力曲线仍在继续上行
公开 IQ 风格测试仍是不完美的工具,用于衡量前沿模型。TrackingAI 运行一个公开 Mensa 风格基准,同时也维护一个更严格的私下离线测试。
IQ 风格测试把认知表现的一个狭窄切片压缩成一个数字,从而掩盖了不同推理类型、上下文处理、创造力以及真实世界问题解决能力之间的差异。
无论对 AI 还是人类来说,分数都受测试设计、训练暴露以及模式熟悉度影响,这使得它成为衡量通用能力的一个带噪代理指标。
150 分的 IQ 位于分布的极端高尾区域,往往与像 Albert Einstein 或 Richard Feynman 这类个体相关。在实际层面上,这意味着非常快的抽象能力、强大的模式识别能力,以及在有限引导条件下驾驭复杂的多步骤问题的能力。
平台会把分数作为最近完成任务的滚动平均来报告,而其方法学会引出熟悉的疑问:提示结构、可复现性、训练集污染以及格式熟悉度等。这些担忧在 o3 达到 136 时就已可见,现在 GPT-5.4 Pro 处于 150 时它们依然存在。
相关阅读
OpenAI 的 o3 在 Mensa Norway 测试中得分 136,超过 98% 的人群
OpenAI 的 o3 模型在独立测试中达到 Mensa 级别 IQ。
Apr 17, 2025 · Liam ‘Akiba’ Wright
即便存在这些限制,更广泛的模式也变得更难被忽视。单个孤立的基准结果可能被解释为偶然怪异。来自公开 IQ 风格测试、编码、浏览器使用、桌面导航以及知识工作表现的一组增益,具有更高的分析权重。
TrackingAI 的最新排行榜把 GPT-5.4 Pro 排在其公开 IQ 榜单的首位,领先于所有 Cluade、Gemini、Qwen 和 Grok 模型。它提供了一个外部、可读的公开基准,并且能快速映射到更广泛的能力讨论中。
很少有人需要详细理解基准设计才能明白 150 落在一个罕见区间;也不需要投资者接受 IQ 风格测试背后的每一个前提,来认识到这种规模的跃升更像是加速而非漂移。
标题为“AI IQ 测试结果”的图表:在钟形曲线上展示主要 AI 模型的平均 Mensa Norway IQ 分数,OpenAI 的 GPT-5.4 变体被标在范围上端附近。
企业采购方也不需要相信 IQ 等同于一般智能,才能看到那些具备更强模式识别、更强工具使用以及更强长视野任务处理能力的系统正在迈向在经济上有用的领域,远远超越“解谜”本身。
这指向的是能够在延展语境中搜索、规划、验证、导航并产出真实工作的系统。在这样的背景下,IQ 分数更像是前沿推理“密度”的信号,而不只是一个新奇的数字。
排行榜本身也具有竞争价值。在公开基准上取得领先地位,会巩固 OpenAI 在可见能力领先竞赛中的声望,尤其是在模型差异越来越难仅凭架构备注就辨识出来的当下。
基准领先会把复杂性压缩为一个简单的层级结构。它给开发者一个信号,给企业采购方一个叙事抓手,给投资者另一个衡量能力前沿当前所在位置的代理指标。
CryptoSlate 每日简报
每日信号,零噪音。
每个清晨,用一段紧凑的阅读带来影响市场的头条与背景信息。
5 分钟简读 10 万+ 读者
电子邮件地址
获取简报
免费。无垃圾邮件。随时取消订阅。
糟了,似乎出现了问题。请重试。
你已订阅。欢迎登船。
OpenAI 的基准攀升开始与未来一周的经济大势重叠
未来一周仍将以宏观为主。美国劳工统计局的日历清楚列出了下一批关键数据发布:4 月 8 日到期发布的 3 月 17 日至 18 日会议的 FOMC 纪要;4 月 10 日到期发布的 3 月消费者价格指数;以及 4 月 14 日到期发布的 3 月生产者价格指数。
这一日程让利率、通胀和增长焦虑继续处于前台,但在其表面之下,第二条经济脉络正在成形,而 OpenAI 正位于其中心附近。
前沿 AI 的能力增长越来越与资本配置相交。一种模型如果能在公开推理测试中取得更高分,同时在编码、搜索以及计算机使用方面也有所改进,会改变企业如何思考工作流改造。它会改变软件采购方对搭档(copilots)和代理(agents)的期待。它会改变企业从试验到部署所需的速度。
Jack Dorsey 最近发帖称,Block 正在“从层级走向智能”,使用 AI 来接管原本由管理层承担的协调工作,原因是公司在围绕个人贡献者、直接负责的个人以及球员教练进行重组。
能力增长也会改变哪些任务可以从劳动力成本结构中被剥离出来,并重新分配给软件。这些影响会先通过更狭窄的渠道传播,包括文档工作流、电子表格工作流、客户支持、研究任务、浏览器自动化、内部运营、代码生成以及验证循环。
OpenAI 的商业方向强化了这种解读。在其 GPT-5.4 上市材料中,公司描述了在专业工作中的更强表现、在工具搜索方面的更强能力、原生计算机使用能力,以及在跨职业的、基准化的知识工作方面的增益——这些岗位与美国经济能够直接对应。
这把 AI 能力增长放进了一个熟悉的市场问题之中:如果这些系统继续以这种速度提升,那么支出资金接下来会流向哪里。
答案不仅扩展到模型订阅收入,还延伸到云需求、芯片、数据中心、网络、电力、软件许可证以及劳动力生产率的假设。OpenAI 扩大的资本回路已经反映了其中一部分结构,而基准带来的增益又在其上叠加了一个更简单、面向公众的信号。
这种重叠,正是让最新结果在一个以宏观为主导的周期间具备更广泛的相关性。市场已经知道 CPI 的布局。市场已经知道油价可以进入通胀预期。市场也已经知道美联储纪要会被用来解析政策口径。
但智能本身的增长是否开始表现得像一种宏观变量?更快的能力增速可能会改变企业的支出计划,拉紧白领职能之间的竞争压力,支撑更高的基础设施投入,并在名义增长较慢的环境中强化将资本支出与 AI 关联起来的论点。
当 TrackingAI 把 GPT-5.4 Pro 展示为 150 分时,这个数字落在一个市场之中;在该市场里,投资者已经把 OpenAI 看作不只是实验室。它是一家平台公司、一家部署公司、一个基础设施层面的客户,以及相邻行业的信号生成器。
下一项测试同时在两个地方展开。一个是方法论;公开 IQ 风格基准将继续招致审视,而且应该如此。另一个是经济层面;市场会一步步做出判断:这种规模的能力跃迁是否值得与劳动力数据、利率预期和资本开支趋势一并定价。
OpenAI 最新的基准攀升把这一决策推得更近了。该分数简洁、易于理解,也便于传播。它更深的相关性来自与公司更广泛产品推动相同的地方;前沿仍在上升,而这次攀升所带来的经济足迹也正变得更难被单独归入另一类。
本文提及
发布于
精选 美国 科技 文化 AI 社区
语境
相关报道
切换分类以深入探索或获取更广泛背景。
分析
为什么比特币因伊朗协议希望短暂突破 70,000 美元:特朗普通道的霍尔木兹威胁让反弹仍脆弱
油价接近 112 美元,同时 CPI 和美联储因素临近,可能决定这次反弹能否继续,还是会演变为更深的回撤。
2 分钟前
分析
Citadel Securities 和 Fidelity 刚刚做出了迄今最清晰的举动:重建像华尔街一样的加密
如果机构跟进,这份申报可能会把更多加密交易的后台工作转移到由联邦监管的手中。
4 小时前
华尔街认为,随着华盛顿重写 401(k) 规则,存在 100万亿美元的市场空白
分析 · 12 小时前
强劲美国就业报告推迟美联储的宽慰举措,尽管比特币面临下一次宏观考验
分析 · 1 天前
比特币国库交易面临压力测试:债务压力触发抛售
分析 · 2 天前
比特币衍生品闪现警告:460 亿美元市场从伊朗停火集会中回落
分析 · 2 天前
AI
加密 AI 项目 OpenServ 声称在直接基准对比中击败 OpenAI
这个 AI-加密平台对 OpenAI 做出更大幅度的主张,提高了对可验证性、部署以及代币可信度的要求。
2 小时前
科技
Ripple 向银行推动更私密的区块链,并在担忧增长之际加入 AI 代码检查:担心可能让 XRP 价格落后
Ripple 旨在通过增强隐私与 AI 安全功能来革新面向机构的区块链,XRPL。
1 周前
AI 带来的加密赢家并非 AI 币:代理开始自主花钱
分析 · 1 周前
AI 重置正在进行:裁员加速,一组人受到的打击最为严重
AI · 4 周前
加密能否保护我们免受日益庞大的经济型 AI 代理网络?
AI · 4 周前
AI 正在招募更多资深开发者,同时悄悄抹去那些创造这些岗位的工作
AI · 1 个月前
CoinRabbit 降低 XRP 贷款与 300+ 种资产的加密借贷利率
随着借贷利率现在开始降至 11.95%,CoinRabbit 正在扩大面向 XRP 以及 300+ 支持资产的低成本、以加密资产作抵押借款。
3 小时前
ADI Chain 宣布 ADI Predictstreet,成为 FIFA 世界杯 2026 预测市场合作伙伴
得益于 ADI Chain,ADI Predictstreet 将在足球最宏大的舞台亮相,成为 FIFA 世界杯 2026 官方预测市场合作伙伴。
3 天前
BTCC 交易所被任命为阿根廷国家队官方区域合作伙伴
PR · 4 天前
Encrypt 将来到 Solana,为加密资本市场提供支持
PR · 6 天前
Ika 将来到 Solana,为无跨链(Bridgeless)资本市场提供支持
PR · 6 天前
TxFlow L1 主网启动标志着多应用链上金融进入新阶段
PR · 6 天前
免责声明
我们的作者观点仅代表其自身,不代表 CryptoSlate 的观点。你在 CryptoSlate 上阅读的任何信息都不应被视为投资建议;CryptoSlate 也不为本文中可能被提及或链接的任何项目背书。购买和交易加密货币应当视为高风险活动。在采取与本文内容相关的任何行动之前,请自行完成尽职调查。最后,如果你在交易加密货币时亏损,CryptoSlate 不承担任何责任。有关更多信息,请参阅我们的公司免责声明。