04:00
Gata lança um conjunto de dados de conversação ChatGPT de usuários reais em grande escala, ChatGPT-RealUser-2.2M
Mensagem ChainCatcher, a empresa de infraestrutura de IA Descentralização Gata anunciou o lançamento do conjunto de dados de conversação de usuários reais do ChatGPT em grande escala global, ChatGPT-RealUser-2.2M. Este conjunto de dados foi coletado através do programa GPT-to-Earn da Gata (participação voluntária dos usuários), reunindo mais de 2,24 milhões de conversas reais e quase 3,56 milhões de perguntas e respostas, provenientes de mais de 15 mil usuários reais, cobrindo interações com GPT-3.5, GPT-4 e o1.
De acordo com a apresentação, este conjunto de dados é aproximadamente o dobro do tamanho de conjuntos de dados semelhantes do Allen Institute for AI, cobrindo cenários reais e diálogos de múltiplas rodadas, e devido ao mecanismo de incentivo em cadeia, contém uma grande quantidade de interações relacionadas com criptomoedas. A versão de pré-visualização já está disponível em
GPT-3.24%