Anthrope entrenó su IA con millones de libros con derechos de autor. Un juez que realmente parecía (con una gran estrella) – Diario cr

Anthrope acaba de lograr una victoria legal muy importante en esta disputa legal, que el mundo de la IA mantiene con derechos de autor y derechos de autor durante años. La oración por oración antropicalmente favorable puede tener un gran precedente para el resto de los casos en los que las compañías de IA fueron demandadas por capacitar a sus modelos con trabajo con derechos de autor. Pero tenga cuidado porque no fue una victoria total.

Victoria antópica. A la demanda de tres autores contra Anthrope, la compañía fue acusada de descargar millones de libros con derechos de autor, y algunos de ellos para escanear y digitalizar. El objetivo: entrena a tus modelos de IA. El juez William Alsup lo dejó en claro En su oración El «uso para el entrenamiento fue un uso justo». Las empresas que desarrollan modelos de IA siempre han sido protegidas en este concepto para argumentar solo cómo sus modelos con todo tipo de obras, incluidos los que están protegidos por derechos de autor.

Uso justo. Este criterio legal afirma que el uso limitado del material protegido está permitido sin el permiso del propietario de estos derechos. En las leyes de los derechos de autor, los jueces deben determinar si este tipo de actividad es un uso justo para examinar si este uso fue «transformador». O qué es lo mismo cuando se ha creado algo nuevo a partir de estas obras. Para Alsup, «la tecnología en cuestión es una de las más transformador que muchos de nosotros veremos en nuestras vidas».

Una victoria con una gran estrella. Aunque el juez declaró que este proceso de capacitación era un uso justo, también descubrió que los autores podían liderar antropicalmente para piratear sus obras. La compañía argumentó que esto estaba justificado porque era «al menos razonablemente necesario capacitar a los LLM». Para el problema, el problema es exactamente que, aunque compraron algunos de ellos, construyó una enorme biblioteca por la que no pagó:

«Anthrope descargó más de siete millones de copias de los Piratas de libros, no pagó nada y mantuvo estas copias piratas en su biblioteca, aunque decidió que no las usaría para entrenar su IA (en absoluto o nuevamente).

Caso precedente de Thomson-Reters. Hace unos meses, Thomson Reuters recibió una demanda en 2020 contra una startup de inteligencia de Ross así llamada. Según la compañía, la compañía reprodujo material de su división de investigación legal llamada Westlaw. El juez rechazó los argumentos de la defensa y explicó que el argumento para el uso justo no podría aplicarse en este caso. El juicio contra Anthrope está en la dirección opuesta y bendice este tipo de uso … mientras que las compañías compran el trabajo con el que entrenan sus modelos. Por cierto, la compañía de AI ya había logrado una pequeña victoria legal en un caso anterior contra la música universal.

Libros de trabajo de pieza descargada antropicalmente. El estudio fue anunciado Los libros tan llamados3 O Libgen (Biblioteca Genesis), que no son más que una composición de libros gigantescas, muchos de los cuales están protegidos por los derechos de autor.

El objetivo es el mismo. Todas las empresas que desarrollan modelos de IA han sido capacitadas con todo tipo de datos, incluido el trabajo protegido por los derechos de autor, y todos están expuestos a una situación similar. Meta, por ejemplo, ha descargado libros de 81.7 TB con copyright a través de BitTorrent para capacitar a sus modelos de IA. Esto significa que la compañía de Mark Zuckerberg sufre para sufrir un objetivo que se asemeja a los antrópicos que tiene un nuevo proceso judicial muy peligroso para sus finanzas frente a él.

Una multa potencial de miles de millones de dólares. Como se indica en Wired, la multa mínima para este tipo de violación de derechos de autor es de $ 750 por libro. Alsup declaró que la biblioteca antrópica descargada ilegalmente consta de al menos siete millones de libros, y esto significa que la compañía está expuesta a una multa potencialmente grande. Por el momento no hay fecha para esta nueva versión de prueba.

La batalla interminable de la IA y los derechos de autor. Este es el último episodio de una telenovela que sin duda veremos muchos otros capítulos. Empresas como Google, Openai o Confusion fueron igualmente insaciables en la capacitación de sus modelos y tienen datos públicos (y no tan públicos) destruidos en Internet. Los requisitos de violación de los derechos de autor se reúnen, y los casos como los antropas pueden ocurrir para todos si no ha comprado los libros con los que ha capacitado a sus modelos.

Imagen | Emil Widlund

En | 5,000 «tokens» de mi blog se utilizan para entrenar una IA. No di mi permiso