Scan to Download Gate App
qrCode
More Download Options
Don't remind me again today

Yapay zeka'nın pekiştirme öğrenimi gerçekten üç belirli senaryoda parlıyor. Bir düşünün - sistemin hataları zarif bir şekilde ele alması gerekiyor, yani sadece sıfırlayıp tekrar deneyebilirsiniz. Hız da önemli; eğer her deneme sonsuza kadar sürerse, eğitim pratik olmaktan çıkar. Ve işte en önemli nokta: her denemeyi puanlamak için otomatik bir yol olmalı. İnsan yargısına ihtiyaç yok. Bu üç kutu işaretlendiğinde - hızlı sıfırlamalar, hızlı yinelemeler ve otomatik geri bildirim - işte o zaman RL algoritmaları gerçekten başarılı oluyor.

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • 3
  • Repost
  • Share
Comment
0/400
WalletAnxietyPatientvip
· 17h ago
Hmm.. yani RL, hızlı deneme-yanılma ve otomatik geri bildirim sistemiyle çalışmalı, yoksa gerçekten bir anlamı yok.
View OriginalReply0
SatoshiNotNakamotovip
· 17h ago
Açıkçası, RL bu tuzak sadece oyunda işliyor, gerçek hayatta o koşullar bir araya gelmediğinde durum oldukça garip.
View OriginalReply0
ChainSpyvip
· 17h ago
Ha, bu üç koşul açıkça RL'nin hayatta kalma kurallarıdır, başarısızlık tekrar deneyebilir, hız ayak uydurmalı, otomatik puanlama... Tamamen oyun ve simülasyon ortamları için özel olarak tasarlanmış.
View OriginalReply0
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate App
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)