ChainCatcherメッセージ、分散化AIインフラ企業Gataは、全世界規模のリアルユーザーChatGPT対話データセットChatGPT-RealUser-2.2Mを発表しました。このデータセットは、GataのGPT-to-Earnプログラム(ユーザーの自発的参加)を通じて収集され、2024年から2025年の間に224万件以上のリアル対話、近356万組のQ&Aを集め、1.5万人以上のリアルユーザーからの情報を含み、GPT-3.5、GPT-4およびo1とのインタラクションをカバーしています。
紹介によると、このデータセットはAllen Institute for AIの以前の同様のデータセットの約2倍の規模で、リアルなシーンや多輪対話をカバーしており、チェーン上のインセンティブメカニズムにより、大量の暗号関連のインタラクションが含まれています。プレビュー版はHugging Faceで公開されており、600件の対話サンプルが含まれています。完全なデータセットは研究および商業アプリケーションに使用できます。
報道によると、2025年5月にGataはYZi Labs、IDG Blockchainなどが参加した総額400万ドルのシードラウンドの資金調達を完了したと発表しました。
Gata、リアルユーザー向けのグローバル大規模ChatGPT会話データセット「ChatGPT-RealUser-2.2M」をリリース
ChainCatcherメッセージ、分散化AIインフラ企業Gataは、全世界規模のリアルユーザーChatGPT対話データセットChatGPT-RealUser-2.2Mを発表しました。このデータセットは、GataのGPT-to-Earnプログラム(ユーザーの自発的参加)を通じて収集され、2024年から2025年の間に224万件以上のリアル対話、近356万組のQ&Aを集め、1.5万人以上のリアルユーザーからの情報を含み、GPT-3.5、GPT-4およびo1とのインタラクションをカバーしています。 紹介によると、このデータセットはAllen Institute for AIの以前の同様のデータセットの約2倍の規模で、リアルなシーンや多輪対話をカバーしており、チェーン上のインセンティブメカニズムにより、大量の暗号関連のインタラクションが含まれています。プレビュー版はHugging Faceで公開されており、600件の対話サンプルが含まれています。完全なデータセットは研究および商業アプリケーションに使用できます。 報道によると、2025年5月にGataはYZi Labs、IDG Blockchainなどが参加した総額400万ドルのシードラウンドの資金調達を完了したと発表しました。