ブルームバーグを引用したIT Houseによると、スタンフォード大学は最近、オープンソースモデルのトレーニングデータセットLAION-5Bに関する調査を実施し、データセットに3,000件の「児童性的虐待の疑いのあるコンテンツ」が含まれていることを発見し、その後、LAIONプロジェクトのメンテナーはLAION-5Bを緊急に削除し、1,008件の「決定的な関連コンテンツ」を削除したと主張しました。 レポートによると、LAION-5Bトレーニングセットには合計58億5000万個の画像情報があり、Stability AIはLAIONデータセットを使用して独自のAIモデルをトレーニングし、ユーザーに「Wensheng Graph Service」を提供しています。
この点について、Stability AIは海外メディアの取材に対し、「Stable DiffusionモデルはLAION-5Bで学習しているが、トレーニングセットを『フィルタリングして微調整した』バージョンを使用しているため、『モデルの出力結果には影響しない』」と回答しています。
20.2K 人気度
32.2K 人気度
76.9K 人気度
10.3K 人気度
25.1K 人気度
スタンフォード大学は、LAION-5Bに「児童性的虐待コンテンツ」が含まれていることを明らかにし、Stable AIはデータセットを使用してモデルをトレーニングしました
ブルームバーグを引用したIT Houseによると、スタンフォード大学は最近、オープンソースモデルのトレーニングデータセットLAION-5Bに関する調査を実施し、データセットに3,000件の「児童性的虐待の疑いのあるコンテンツ」が含まれていることを発見し、その後、LAIONプロジェクトのメンテナーはLAION-5Bを緊急に削除し、1,008件の「決定的な関連コンテンツ」を削除したと主張しました。 レポートによると、LAION-5Bトレーニングセットには合計58億5000万個の画像情報があり、Stability AIはLAIONデータセットを使用して独自のAIモデルをトレーニングし、ユーザーに「Wensheng Graph Service」を提供しています。
この点について、Stability AIは海外メディアの取材に対し、「Stable DiffusionモデルはLAION-5Bで学習しているが、トレーニングセットを『フィルタリングして微調整した』バージョンを使用しているため、『モデルの出力結果には影響しない』」と回答しています。