Stanford revelou que o LAION-5B continha "conteúdo de abuso sexual infantil", e a Stable AI usou o conjunto de dados para treinar o modelo

2023-12-22 05:30:26

De acordo com a IT House, citando a Bloomberg, a Universidade de Stanford realizou recentemente um estudo sobre o conjunto de dados de treinamento de modelo de código aberto LAION-5B e descobriu que havia 3.000 “conteúdo suspeito de abuso sexual infantil” no conjunto de dados, após o qual os mantenedores do projeto LAION removeram urgentemente o LAION-5B e afirmaram ter removido 1.008 “conteúdo relacionado conclusivo”. De acordo com o relatório, o conjunto de treinamento LAION-5B tem um total de 5,85 bilhões de informações de imagem, e a Stability AI usou o conjunto de dados LAION para treinar seu próprio modelo de IA, de modo a fornecer aos usuários um “Wensheng Graph Service”.

A este respeito, a Stability AI respondeu rapidamente à mídia estrangeira: “Embora o modelo de Difusão Estável seja treinado com LAION-5B, ele usa uma versão ‘filtrada e ajustada’ do conjunto de treinamento, então ‘não afeta os resultados de saída do modelo’”.

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.