Selon IT House, citant Bloomberg, l’Université de Stanford a récemment mené une étude sur l’ensemble de données d’entraînement du modèle open source LAION-5B et a constaté qu’il y avait 3 000 « contenus présumés d’abus sexuels sur des enfants » dans l’ensemble de données, après quoi les mainteneurs du projet LAION ont supprimé d’urgence LAION-5B et ont affirmé avoir supprimé 1 008 « contenus connexes concluants ». Selon le rapport, l’ensemble d’apprentissage LAION-5B contient un total de 5,85 milliards d’informations d’image, et Stability AI a utilisé l’ensemble de données LAION pour entraîner son propre modèle d’IA, afin de fournir aux utilisateurs un « service de graphe Wensheng ».
À cet égard, Stability AI a rapidement répondu aux médias étrangers : « Bien que le modèle de diffusion stable soit entraîné avec LAION-5B, il utilise une version « filtrée et affinée » de l’ensemble d’apprentissage, de sorte qu’il « n’affecte pas les résultats de sortie du modèle » ».
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Stanford a révélé que LAION-5B contenait du « contenu pédopornographique », et Stable AI a utilisé l’ensemble de données pour entraîner le modèle
Selon IT House, citant Bloomberg, l’Université de Stanford a récemment mené une étude sur l’ensemble de données d’entraînement du modèle open source LAION-5B et a constaté qu’il y avait 3 000 « contenus présumés d’abus sexuels sur des enfants » dans l’ensemble de données, après quoi les mainteneurs du projet LAION ont supprimé d’urgence LAION-5B et ont affirmé avoir supprimé 1 008 « contenus connexes concluants ». Selon le rapport, l’ensemble d’apprentissage LAION-5B contient un total de 5,85 milliards d’informations d’image, et Stability AI a utilisé l’ensemble de données LAION pour entraîner son propre modèle d’IA, afin de fournir aux utilisateurs un « service de graphe Wensheng ».
À cet égard, Stability AI a rapidement répondu aux médias étrangers : « Bien que le modèle de diffusion stable soit entraîné avec LAION-5B, il utilise une version « filtrée et affinée » de l’ensemble d’apprentissage, de sorte qu’il « n’affecte pas les résultats de sortie du modèle » ».