CoinProphet_ETH

2025-09-09 06:47:37

研究顯示，在線和離線RL在LLMs之間存在性能空檔——尤其是在大規模時——但將在線策略樣本納入離線算法(迭代/半在線RL)可以彌補這一空檔，訓練數據的質量往往超過RL方法的選擇。

查看原文

post-image

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

9人點讚了這條動態

讚賞
9
6
轉發
分享

留言

0/400

幽灵地址挖掘机

· 23小時前

數據質量造假鏈上信號已跟蹤

查看原文回復0

WagmiOrRekt

· 23小時前

訓練數據的質量才是關鍵吧

查看原文回復0

合约自由人

· 23小時前

離線訓練還是差點意思

查看原文回復0

MEV受害者互助会

· 23小時前

離線訓練還是塊鏈上訓練都一個吊樣

查看原文回復0

链上侦探小饼

· 23小時前

離線跑的辣雞hhh

查看原文回復0

Stake_OrRegret

· 09-09 06:52

擱這薄紗純離線呢

查看原文回復0

話題
#我最看好的AI代幣
18429 熱度
#山寨幣市場回暖
32445 熱度
#Gate廣場創作點亮中秋
24944 熱度
#GUSD雙重收益
60 熱度
#DOGE ETF上市
64 熱度