El fallo obliga a OpenAI a proporcionar 20 millones de registros de chat tras meses de disputas sobre privacidad, conservación y alcance.
La jueza Ona T. Wang dictaminó que el tamaño de la muestra es “proporcional” a lo que el caso necesita para demostrar si las respuestas de ChatGPT reprodujeron contenido del Times.
El caso se suma a una creciente ola de desafíos por derechos de autor dirigidos a cómo los laboratorios de IA obtienen y utilizan los datos de entrenamiento.
El centro de Arte, Moda y Entretenimiento de Decrypt.
Descubre SCENE
Una jueza federal ha ordenado a OpenAI entregar aproximadamente 20 millones de registros de ChatGPT desidentificados a The New York Times y otros demandantes, lo que aumenta la exposición de la empresa de desarrollo de IA a una serie de disputas sobre derechos de autor y gobernanza de datos.
La orden, emitida el miércoles en Nueva York, rechaza la solicitud de OpenAI de bloquear la entrega de los registros de chat de los usuarios y ordena a la empresa entregar los registros bajo un marco de protección.
El resultado podría influir en cómo empresas tecnológicas como OpenAI, Anthropic y Perplexity obtienen datos de entrenamiento, licencian contenido y establecen límites sobre qué pueden generar sus sistemas.
Si bien el tribunal “reconoce que las consideraciones de privacidad de los usuarios de OpenAI son sinceras”, tales consideraciones “son solo un factor en el análisis de proporcionalidad y no pueden predominar cuando hay una clara relevancia y una carga mínima”, escribió la jueza magistrada Ona T. Wang.
Decrypt se ha puesto en contacto con ambas partes para obtener comentarios.
La orden surge de la demanda en curso del Times, que alega que los modelos de OpenAI se entrenaron con contenido periodístico protegido por derechos de autor sin permiso. La demanda se presentó por primera vez en diciembre de 2023.
En enero del año pasado, OpenAI impugnó las afirmaciones del NYT y presentó una contrademanda, alegando que la publicación no estaba “contando toda la historia”.
Posteriormente, el tribunal determinó que las 20 millones de muestras de registros de chat en cuestión son “proporcionales a las necesidades del caso” para evaluar si las respuestas de ChatGPT copiaron el material del NYT.
Durante el último año, la disputa se ha intensificado, con los demandantes presionando para obtener un amplio acceso a los datos de salida, y OpenAI advirtiendo que la producción masiva de estos materiales supondría cargas de privacidad y operativas.
En junio, OpenAI sufrió otro revés cuando el tribunal ordenó a la empresa conservar una amplia gama de datos de usuarios de ChatGPT para la demanda, incluidos chats que los usuarios ya podrían haber eliminado.
Meses después, en octubre, la disputa resurgió, cuando el tribunal señaló la presentación de OpenAI del 20 de octubre (ECF 679) que impugnaba la entrega de la muestra de 20 millones de registros, y ordenó a ambas partes presentar aclaraciones sobre los motivos de su desacuerdo.
En ese momento, la jueza instó a las partes a explicar cómo la disputa se relacionaba con preocupaciones anteriores sobre los registros eliminados y si OpenAI se había retractado de acuerdos previos sobre lo que afirmaba que entregaría.
A finales del mes pasado, OpenAI presentó una objeción formal solicitando al juez de distrito que revocara la orden de descubrimiento de la jueza magistrada.
La empresa argumentó que el fallo era “claramente erróneo” y “desproporcionado”, ya que obligaría a la empresa a revelar millones de conversaciones privadas de usuarios, según un documento judicial compartido con Decrypt por un representante de OpenAI.
La disputa surge como parte de una ofensiva más amplia contra los laboratorios de IA, con autores, medios de comunicación, editoriales musicales y repositorios de código que buscan poner a prueba hasta dónde llega la legislación actual sobre derechos de autor cuando los modelos ingieren y reproducen material protegido.
Los tribunales de EE. UU. y Europa están ahora evaluando reclamaciones similares.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Se ordena a OpenAI entregar 20 millones de registros de ChatGPT en el caso de derechos de autor del NYT
En resumen
El centro de Arte, Moda y Entretenimiento de Decrypt.
Descubre SCENE
Una jueza federal ha ordenado a OpenAI entregar aproximadamente 20 millones de registros de ChatGPT desidentificados a The New York Times y otros demandantes, lo que aumenta la exposición de la empresa de desarrollo de IA a una serie de disputas sobre derechos de autor y gobernanza de datos.
La orden, emitida el miércoles en Nueva York, rechaza la solicitud de OpenAI de bloquear la entrega de los registros de chat de los usuarios y ordena a la empresa entregar los registros bajo un marco de protección.
El resultado podría influir en cómo empresas tecnológicas como OpenAI, Anthropic y Perplexity obtienen datos de entrenamiento, licencian contenido y establecen límites sobre qué pueden generar sus sistemas.
Si bien el tribunal “reconoce que las consideraciones de privacidad de los usuarios de OpenAI son sinceras”, tales consideraciones “son solo un factor en el análisis de proporcionalidad y no pueden predominar cuando hay una clara relevancia y una carga mínima”, escribió la jueza magistrada Ona T. Wang.
Decrypt se ha puesto en contacto con ambas partes para obtener comentarios.
La orden surge de la demanda en curso del Times, que alega que los modelos de OpenAI se entrenaron con contenido periodístico protegido por derechos de autor sin permiso. La demanda se presentó por primera vez en diciembre de 2023.
En enero del año pasado, OpenAI impugnó las afirmaciones del NYT y presentó una contrademanda, alegando que la publicación no estaba “contando toda la historia”.
Posteriormente, el tribunal determinó que las 20 millones de muestras de registros de chat en cuestión son “proporcionales a las necesidades del caso” para evaluar si las respuestas de ChatGPT copiaron el material del NYT.
Durante el último año, la disputa se ha intensificado, con los demandantes presionando para obtener un amplio acceso a los datos de salida, y OpenAI advirtiendo que la producción masiva de estos materiales supondría cargas de privacidad y operativas.
En junio, OpenAI sufrió otro revés cuando el tribunal ordenó a la empresa conservar una amplia gama de datos de usuarios de ChatGPT para la demanda, incluidos chats que los usuarios ya podrían haber eliminado.
Meses después, en octubre, la disputa resurgió, cuando el tribunal señaló la presentación de OpenAI del 20 de octubre (ECF 679) que impugnaba la entrega de la muestra de 20 millones de registros, y ordenó a ambas partes presentar aclaraciones sobre los motivos de su desacuerdo.
En ese momento, la jueza instó a las partes a explicar cómo la disputa se relacionaba con preocupaciones anteriores sobre los registros eliminados y si OpenAI se había retractado de acuerdos previos sobre lo que afirmaba que entregaría.
A finales del mes pasado, OpenAI presentó una objeción formal solicitando al juez de distrito que revocara la orden de descubrimiento de la jueza magistrada.
La empresa argumentó que el fallo era “claramente erróneo” y “desproporcionado”, ya que obligaría a la empresa a revelar millones de conversaciones privadas de usuarios, según un documento judicial compartido con Decrypt por un representante de OpenAI.
La disputa surge como parte de una ofensiva más amplia contra los laboratorios de IA, con autores, medios de comunicación, editoriales musicales y repositorios de código que buscan poner a prueba hasta dónde llega la legislación actual sobre derechos de autor cuando los modelos ingieren y reproducen material protegido.
Los tribunales de EE. UU. y Europa están ahora evaluando reclamaciones similares.