La expansión de los modelos de inteligencia artificial generativa plantea interrogantes fundamentales sobre la relación entre innovación tecnológica y derechos de autor. El tercer informe de la Oficina de Derechos de Autor de Estados Unidos (Copyright and Artificial Intelligence. Part 3: Generative AI Training), publicado en mayo de 2025, aborda de manera específica el uso de obras protegidas en los procesos de entrenamiento de estos modelos.
Uno de sus principales aportes es la sugerencia de avanzar hacia el desarrollo de mercados de licencias que permitan a los titulares de derechos negociar y controlar el uso de sus contenidos por parte de sistemas de IA, así como la implementación de mecanismos que fortalezcan su capacidad de decisión sobre ese uso. Como señala el documento: “Los mercados de licencias podrían ayudar a reducir el riesgo legal para los desarrolladores, fomentar la compensación para los titulares de derechos y proporcionar más transparencia en el uso de contenido protegido por copyright”.
El informe fue publicado en un contexto de fuerte controversia institucional. Pocos días después de su presentación, la jefa de la Oficina de Derechos de Autor (US Copyright Office), Shira Perlmutter, fue desplazada de su cargo, en una decisión que muchos interpretaron como una reacción política ante el contenido del documento. Aunque el informe no establece normas vinculantes, sus implicancias resultan sensibles para los principales actores del sector, en particular las grandes tecnológicas y los titulares de derechos.
A lo largo del texto, la Oficina analiza si el uso de obras protegidas para entrenar modelos de IA puede considerarse “uso justo” (fair use) bajo el derecho estadounidense, y expone distintos escenarios y precedentes judiciales. El uso justo (fair use) es una excepción al derecho de autor que permite utilizar obras protegidas sin pedir permiso, cuando se hace con fines como crítica, comentario, docencia, investigación o parodia, y siempre que se respeten ciertos criterios legales.
El informe concluye que «la aplicabilidad del uso justo dependerá de los hechos específicos de cada caso, incluidos los objetivos del sistema de IA, su funcionamiento y sus resultados». No obstante, identifica riesgos significativos, sobre todo en relación con la capacidad de algunos modelos de memorizar y reproducir fragmentos exactos de obras protegidas.
El núcleo de la propuesta está en la creación de un sistema de licencias que permita a los titulares de derechos otorgar -o denegar- el uso de sus obras para el entrenamiento de sistemas de IA, en condiciones contractuales claras. Esta medida apunta a resolver una tensión creciente: por un lado, las empresas de IA requieren acceso a grandes cantidades de datos para entrenar modelos cada vez más precisos y potentes; por el otro, creadores y editoras reclaman que se respete la titularidad de sus obras. El informe considera que «una vía de licenciamiento permitiría resolver conflictos sin necesidad de litigio y favorecería la sostenibilidad del ecosistema creativo«.
La implementación de estos mercados de licencias, sin embargo, plantea desafíos técnicos y jurídicos relevantes. En primer lugar, la escala del entrenamiento de modelos es inmensa: se utilizan bases de datos que contienen millones (o incluso miles de millones) de documentos, lo que complica la autorización caso por caso. El informe reconoce esta dificultad: «Los sistemas actuales no siempre hacen un seguimiento preciso del origen de cada obra utilizada en el entrenamiento, lo que puede dificultar el cumplimiento de requisitos de licenciamiento o exclusión». Por eso, se plantea la posibilidad de gestionar derechos mediante entidades colectivas o plataformas intermedias, en analogía con las sociedades de gestión que operan en el sector musical.
Además, se destaca la necesidad de desarrollar herramientas que permitan a los autores ejercer un control más efectivo. Esto incluye la implementación de tecnologías como marcas de agua, etiquetas digitales, o mecanismos de exclusión voluntaria (opt-out) en los que los titulares puedan declarar que no autorizan el uso de sus obras. Las marcas de agua o etiquetas digitales ya vienen siendo impulsadas por el sector privado en iniciativas que tratan de mejorar la calidad de la información que circula en las plataformas, como la Content Authenticity Initiative, a la que Convercom.info adhirió en 2022.
El informe de la US Copyright Office sostiene: «Los desarrolladores de IA podrían verse obligados a ofrecer mecanismos eficaces de exclusión que permitan a los titulares de derechos evitar el uso de sus obras, en lugar de que ellos deban optar expresamente por participar». Asimismo, se plantea la necesidad de mayores obligaciones de transparencia para los desarrolladores de modelos: «Los actores del sector podrían verse incentivados o requeridos a revelar los datos utilizados para el entrenamiento, al menos en términos generales».
En ese marco, la Oficina también alerta sobre los riesgos de memorización por parte de los modelos: “Los sistemas de IA pueden ocasionalmente memorizar y reproducir segmentos sustanciales de obras protegidas, lo que plantea riesgos reales de infracción». Estos casos, especialmente cuando el resultado es sustancialmente similar o idéntico a una obra protegida, no estarían amparados por el uso justo y podrían dar lugar a sanciones. La reproducibilidad sin transformación significativa es uno de los aspectos más críticos del debate actual sobre IA y copyright.
La propuesta de avanzar hacia mercados de licencias se presenta entonces como una alternativa constructiva a una judicialización masiva y fragmentada del problema. Como sintetiza el documento: «Una solución negociada, basada en licencias, evitaría muchos de los costos, demoras y tensiones que genera el litigio prolongado». Esta visión apunta a crear un marco institucional y técnico que permita el desarrollo de la IA sin debilitar los derechos de quienes crean los contenidos que alimentan esos modelos.
En este sentido, la Oficina de Derechos de Autor se ubica en una posición intermedia entre las posturas maximalistas que exigen prohibiciones estrictas y las visiones desreguladas que ven en el uso masivo de datos un supuesto derecho irrestricto. El informe reconoce los aportes de la IA a la innovación y el conocimiento, pero subraya que “el desarrollo tecnológico debe ir acompañado de un respeto efectivo por los principios fundamentales del derecho de autor”.
Copyright-and-Artificial-Intelligence-Part-3-Generative-AI-Training-Report-Pre-Publication-Version
Este texto fue realizado con Inteligencia Artificial Generativa ChatGPT 4.o con supervisión humana
Hacé tu comentario