スタンフォード大学は、LAION-5Bに「児童性的虐待コンテンツ」が含まれていることを明らかにし、Stable AIはデータセットを使用してモデルをトレーニングしました

2023-12-22 05:30:26

ブルームバーグを引用したIT Houseによると、スタンフォード大学は最近、オープンソースモデルのトレーニングデータセットLAION-5Bに関する調査を実施し、データセットに3,000件の「児童性的虐待の疑いのあるコンテンツ」が含まれていることを発見し、その後、LAIONプロジェクトのメンテナーはLAION-5Bを緊急に削除し、1,008件の「決定的な関連コンテンツ」を削除したと主張しました。レポートによると、LAION-5Bトレーニングセットには合計58億5000万個の画像情報があり、Stability AIはLAIONデータセットを使用して独自のAIモデルをトレーニングし、ユーザーに「Wensheng Graph Service」を提供しています。

この点について、Stability AIは海外メディアの取材に対し、「Stable DiffusionモデルはLAION-5Bで学習しているが、トレーニングセットを『フィルタリングして微調整した』バージョンを使用しているため、『モデルの出力結果には影響しない』」と回答しています。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。