Yapay zeka'nın pekiştirme öğrenimi gerçekten üç belirli senaryoda parlıyor. Bir düşünün - sistemin hataları zarif bir şekilde ele alması gerekiyor, yani sadece sıfırlayıp tekrar deneyebilirsiniz. Hız da önemli; eğer her deneme sonsuza kadar sürerse, eğitim pratik olmaktan çıkar. Ve işte en önemli nokta: her denemeyi puanlamak için otomatik bir yol olmalı. İnsan yargısına ihtiyaç yok. Bu üç kutu işaretlendiğinde - hızlı sıfırlamalar, hızlı yinelemeler ve otomatik geri bildirim - işte o zaman RL algoritmaları gerçekten başarılı oluyor.

View Original

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

6 Likes

Reward
6
3
Repost
Share

Comment

0/400

WalletAnxietyPatient

· 17h ago

Hmm.. yani RL, hızlı deneme-yanılma ve otomatik geri bildirim sistemiyle çalışmalı, yoksa gerçekten bir anlamı yok.

View OriginalReply0

SatoshiNotNakamoto

· 17h ago

Açıkçası, RL bu tuzak sadece oyunda işliyor, gerçek hayatta o koşullar bir araya gelmediğinde durum oldukça garip.

View OriginalReply0

ChainSpy

· 17h ago

Ha, bu üç koşul açıkça RL'nin hayatta kalma kurallarıdır, başarısızlık tekrar deneyebilir, hız ayak uydurmalı, otomatik puanlama... Tamamen oyun ve simülasyon ortamları için özel olarak tasarlanmış.

View OriginalReply0

Trending TopicsView More
#TopGainersInADownMarket
11.38K Popularity
#FOMCMeetingMinutesComingUp
10.97K Popularity
#BitcoinPriceWatch
10.16K Popularity
#GovShutdownOfficiallyEnded
32.45K Popularity
#BuyTheDipOrWaitNow?
18.34K Popularity

Hot Gate FunView More

1
GTRENCHESGATE TRENCHES
MC:$3.8KHolders:1
0.00%
2
吉林东哥吉林东哥
MC:$3.75KHolders:1
0.00%
3
TRNTrun the volume up
MC:$3.73KHolders:1
0.00%
4
AKAZA猗窝座
MC:$3.76KHolders:1
0.00%
5
KarinaKarina
MC:$3.72KHolders:1
0.00%

Sitemap