04:00
Gata a publié un ensemble de données de dialogue ChatGPT à grande échelle avec de vrais utilisateurs dans le monde entier, ChatGPT-RealUser-2.2M
Message de ChainCatcher, l'entreprise d'infrastructure AI décentralisée Gata annonce le lancement d'un ensemble de données de conversation ChatGPT à grande échelle avec de véritables utilisateurs, ChatGPT-RealUser-2.2M. Cet ensemble de données a été collecté par le biais du programme GPT-to-Earn de Gata (participation volontaire des utilisateurs), rassemblant au total plus de 2,24 millions de véritables conversations et près de 3,56 millions de paires de questions-réponses, provenant de plus de 15 000 véritables utilisateurs, couvrant les interactions avec GPT-3.5, GPT-4 et o1.
Selon les informations, cet ensemble de données est environ deux fois plus grand que les ensembles de données similaires précédemment publiés par l'Allen Institute for AI, couvrant des scénarios réels et des dialogues en plusieurs tours, et en raison du mécanisme d'incitation en chaîne, il contient de nombreuses interactions liées à la crypto-monnaie. La version d'aperçu est déjà disponible sur
GPT-4.53%