Yapay zeka'nın pekiştirme öğrenimi gerçekten üç belirli senaryoda parlıyor. Bir düşünün - sistemin hataları zarif bir şekilde ele alması gerekiyor, yani sadece sıfırlayıp tekrar deneyebilirsiniz. Hız da önemli; eğer her deneme sonsuza kadar sürerse, eğitim pratik olmaktan çıkar. Ve işte en önemli nokta: her denemeyi puanlamak için otomatik bir yol olmalı. İnsan yargısına ihtiyaç yok. Bu üç kutu işaretlendiğinde - hızlı sıfırlamalar, hızlı yinelemeler ve otomatik geri bildirim - işte o zaman RL algoritmaları gerçekten başarılı oluyor.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
6 Likes
Reward
6
3
Repost
Share
Comment
0/400
WalletAnxietyPatient
· 17h ago
Hmm.. yani RL, hızlı deneme-yanılma ve otomatik geri bildirim sistemiyle çalışmalı, yoksa gerçekten bir anlamı yok.
View OriginalReply0
SatoshiNotNakamoto
· 17h ago
Açıkçası, RL bu tuzak sadece oyunda işliyor, gerçek hayatta o koşullar bir araya gelmediğinde durum oldukça garip.
View OriginalReply0
ChainSpy
· 17h ago
Ha, bu üç koşul açıkça RL'nin hayatta kalma kurallarıdır, başarısızlık tekrar deneyebilir, hız ayak uydurmalı, otomatik puanlama... Tamamen oyun ve simülasyon ortamları için özel olarak tasarlanmış.
Yapay zeka'nın pekiştirme öğrenimi gerçekten üç belirli senaryoda parlıyor. Bir düşünün - sistemin hataları zarif bir şekilde ele alması gerekiyor, yani sadece sıfırlayıp tekrar deneyebilirsiniz. Hız da önemli; eğer her deneme sonsuza kadar sürerse, eğitim pratik olmaktan çıkar. Ve işte en önemli nokta: her denemeyi puanlamak için otomatik bir yol olmalı. İnsan yargısına ihtiyaç yok. Bu üç kutu işaretlendiğinde - hızlı sıfırlamalar, hızlı yinelemeler ve otomatik geri bildirim - işte o zaman RL algoritmaları gerçekten başarılı oluyor.