扫码下载 APP
qrCode
更多下载方式
今天不再提醒

SIMA 2在新游戏上的零样本表现如何?相当不错。但让我感到困扰的是——游戏环境是干净的沙盒,具有固定的规则和明显的反馈循环。现实呢?完全混乱。不可预测的物理,模糊的奖励,无限的边缘案例。这让我怀疑这种游戏能力在跳入混乱的现实场景中到底能存活多少。我们是否过拟合于模拟的完美?

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 5
  • 转发
  • 分享
评论
0/400
WagmiOrRektvip
· 11-18 11:56
游戏里牛逼归牛逼,现实一上手就原形毕露,这不就是所有AI模型的通病么 --- 说白了就是漂亮话,真到了生产环境能跑通才是硬指标 --- 所以问题根本不在SIMA有多强,而是咱们的评测体系太理想化了 --- 这就是为什么我从不信任那些实验室的数据,一堆沙盒里的完美演出 --- overfitting to simulation 这句话说得太绝了,我认可,现实就是会按不同的套路出牌
回复0
governance_ghostvip
· 11-18 11:55
游戏里牛逼,出了沙盒就拉胯,这不就是AI的通病吗 --- 真实世界那套反馈机制根本没法训,模拟完美≠实战无敌 --- 说白了还是在自己设定的规则里跳舞,真碰上黑天鹅事件呢 --- zero-shot确实猛,但simulation gap永远是绕不过去的坎 --- 我就想知道这套东西拿去做autonomous agent能坚持多久 --- 沙盒和混沌之间隔着一整个宇宙,别高估了 --- 这就是为什么我从不信任只在controlled environment里秀肌肉的技术
回复0
ETH三明治侠vip
· 11-18 11:54
游戏里零样本学习牛逼,但现实压根不是这套规则啊…sandbox和chaos根本两回事吧
回复0
ser_ngmivip
· 11-18 11:52
游戏里打得再6,现实里还是得靠运气。sandbox完美≠世界完美,这差距太大了
回复0
ChainChefvip
· 11-18 11:46
说实话,这简直就是流动性问题,只不过是与人工智能模型有关,哈哈。沙盒游戏 ≠ 真实市场混乱。就像在一个干净的测试厨房里尝试复制一个收益农业的配方,然后在实际的波动条件下扔出去……协议立刻崩溃。
查看原文回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)