掃描下載 Gate App
qrCode
更多下載方式
今天不再提醒

人工智能的強化學習在三個特定場景中表現得尤爲出色。想一想——系統需要優雅地處理故障,這意味着你可以直接重置並再試一次。速度也很重要;如果每次嘗試都花費太長時間,訓練就變得不切實際。而且,這裏有個關鍵點:必須有某種自動方法來評分每次嘗試。無需人工判斷。當這三個條件都滿足時——快速重置、快速迭代和自動反饋——這就是強化學習算法大顯身手的地方。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 3
  • 轉發
  • 分享
留言
0/400
钱包恐慌症患者vip
· 11-17 00:23
嗯..所以說RL就是得快速試錯加自動反饋這套才行啊,不然真沒意義
查看原文回復0
SatoshiNotNakamotovip
· 11-17 00:23
說實話,RL這套東西就是遊戲裏才玩得轉啊,現實裏那些條件湊不齊的場景尷尬得很
查看原文回復0
链上资深小透明vip
· 11-17 00:15
哈,這三個條件說白了就是RL的生存法則啊,失敗能重來、速度得跟上、自動打分...簡直就是爲遊戲和模擬環境量身定做
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)