OpenAI、NYTの著作権訴訟で2,000万件のChatGPTログの提出を命じられる

要約

  • この判決により、OpenAIはプライバシー、保存、範囲をめぐる数か月にわたる論争の末、2,000万件のチャットログを提出することを義務付けられました。
  • オナ・T・ワン判事は、サンプルサイズが「事件の立証に必要な範囲に比例している」と判断し、ChatGPTの出力がタイムズのコンテンツを再現したかどうかを証明するために必要であるとしました。
  • この訴訟は、AIラボがどのようにトレーニングデータを調達・使用するかをめぐる著作権問題の高まりの一部となっています。

Decryptのアート、ファッション、エンターテインメントハブ


SCENEを発見する

連邦地方裁判所の判事は、OpenAIに対し、約2,000万件の匿名化されたChatGPTログをニューヨーク・タイムズおよび他の原告側に提出するよう命じ、AI開発企業が著作権やデータガバナンスに関する様々な争点にさらされることとなりました。

この命令は水曜日にニューヨークで出され、OpenAIによるユーザーチャット記録の提出阻止の申し立てを却下し、保護された枠組みのもとでログを引き渡すよう指示しています。

この結果は、OpenAI、Anthropic、Perplexityなどのテック企業がトレーニングデータをどのように調達し、コンテンツをライセンスし、自社システムの出力にどのようなガードレールを設けるかに影響を与える可能性があります。

裁判所は「OpenAIのユーザーのプライバシーへの配慮が誠実であることを認識している」が、そのような配慮は「比例性分析における一要素に過ぎず、明確な関連性と最小限の負担がある場合には優先されるものではない」と、米国地方判事オナ・T・ワンは記しました。

Decryptは両当事者にコメントを求めています。

この命令は、OpenAIのモデルが著作権で保護されたニュースコンテンツを許可なく学習したとするタイムズの継続中の訴訟に端を発しています。訴訟は2023年12月に最初に提起されました。

昨年1月、OpenAIはNYTの主張に異議を唱え、反訴を提起、「完全なストーリーを語っていない」と主張しました。

その後裁判所は、問題となっている2,000万件のチャットログサンプルが「事件の必要性に比例したもの」であり、ChatGPTの出力がNYTの資料をコピーしたかどうかを評価するために必要であると判断しました。

この1年で、原告側が出力データへの幅広いアクセスを求めて争いが激化し、OpenAI側はこれらの資料の大規模な開示がプライバシーや運用上の負担を高めると警告してきました。

6月には、OpenAIにとってさらなる打撃となる判決が下され、訴訟のためにChatGPTユーザーデータの広範な保存が命じられ、ユーザーがすでに削除したチャットも含まれることとなりました。

その数か月後の10月、争いは再燃し、裁判所はOpenAIの10月20日の提出書類(ECF 679)を指摘し、2,000万件のログサンプルの提出に異議を唱えたことから、両者にその理由の明確化を求めました。

当時、判事は両当事者に対し、争点が以前の削除ログへの懸念とどのように関連しているのか、またOpenAIが以前合意した提出内容から後退したのかどうか説明するよう求めました。

先月下旬、OpenAIは正式な異議申立を行い、地方裁判所判事に対し、地方判事による証拠開示命令の取り消しを求めました。

同社は、判決が「明らかに誤り」であり、「不均衡」であると主張し、数百万件のプライベートなユーザー会話の開示を強いられると、OpenAIの代表がDecryptに共有した裁判所文書で述べました。

この争いは、AIラボに対する広範な攻勢の一環であり、作家、報道機関、音楽出版社、コードリポジトリなどが、モデルが保護された資料を取り込み再現する場合に現行著作権法がどこまで及ぶかを試そうとしています。

米国および欧州各地の裁判所で、同様の主張が審理されています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン