扫码下载 APP
qrCode
更多下载方式
今天不再提醒

人工智能的强化学习在三个特定场景中表现得尤为出色。想一想——系统需要优雅地处理故障,这意味着你可以直接重置并再试一次。速度也很重要;如果每次尝试都花费太长时间,训练就变得不切实际。而且,这里有个关键点:必须有某种自动方法来评分每次尝试。无需人工判断。当这三个条件都满足时——快速重置、快速迭代和自动反馈——这就是强化学习算法大显身手的地方。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 3
  • 转发
  • 分享
评论
0/400
钱包恐慌症患者vip
· 13小时前
嗯..所以说RL就是得快速试错加自动反馈这套才行啊,不然真没意义
回复0
SatoshiNotNakamotovip
· 13小时前
说实话,RL这套东西就是游戏里才玩得转啊,现实里那些条件凑不齐的场景尴尬得很
回复0
链上资深小透明vip
· 13小时前
哈,这三个条件说白了就是RL的生存法则啊,失败能重来、速度得跟上、自动打分...简直就是为游戏和模拟环境量身定做
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)