A mensagem do ChainCatcher, a empresa de infraestrutura de IA Descentralização Gata, anunciou o lançamento do conjunto de dados de conversação ChatGPT-RealUser-2.2M com usuários reais em escala global. Este conjunto de dados foi coletado através do programa GPT-to-Earn da Gata (participação voluntária dos usuários), reunindo mais de 2,24 milhões de conversas reais e quase 3,56 milhões de pares de perguntas e respostas, provenientes de mais de 15 mil usuários reais, abrangendo interações com GPT-3.5, GPT-4 e o1.
Segundo a apresentação, este conjunto de dados tem aproximadamente o dobro do tamanho dos conjuntos de dados semelhantes do Allen Institute for AI, cobrindo cenários reais e diálogos multi-turno, e devido ao mecanismo de incentivo em cadeia, inclui uma grande quantidade de interações relacionadas a criptomoedas. A versão de pré-visualização já está disponível no Hugging Face, contendo 600 amostras de diálogos, e o conjunto de dados completo pode ser utilizado para pesquisa e aplicações comerciais.
De acordo com informações, em maio de 2025, a Gata anunciou a conclusão de uma rodada de financiamento semente no valor total de 4 milhões de dólares, com a participação de YZi Labs, IDG Blockchain e outros.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
Gata lança um conjunto de dados de conversação ChatGPT de usuários reais em grande escala, ChatGPT-RealUser-2.2M
A mensagem do ChainCatcher, a empresa de infraestrutura de IA Descentralização Gata, anunciou o lançamento do conjunto de dados de conversação ChatGPT-RealUser-2.2M com usuários reais em escala global. Este conjunto de dados foi coletado através do programa GPT-to-Earn da Gata (participação voluntária dos usuários), reunindo mais de 2,24 milhões de conversas reais e quase 3,56 milhões de pares de perguntas e respostas, provenientes de mais de 15 mil usuários reais, abrangendo interações com GPT-3.5, GPT-4 e o1. Segundo a apresentação, este conjunto de dados tem aproximadamente o dobro do tamanho dos conjuntos de dados semelhantes do Allen Institute for AI, cobrindo cenários reais e diálogos multi-turno, e devido ao mecanismo de incentivo em cadeia, inclui uma grande quantidade de interações relacionadas a criptomoedas. A versão de pré-visualização já está disponível no Hugging Face, contendo 600 amostras de diálogos, e o conjunto de dados completo pode ser utilizado para pesquisa e aplicações comerciais. De acordo com informações, em maio de 2025, a Gata anunciou a conclusão de uma rodada de financiamento semente no valor total de 4 milhões de dólares, com a participação de YZi Labs, IDG Blockchain e outros.