La IA s'enfronta a la indústria del llibre pels drets d'autor
El Parlament Europeu dona suport a la necessitat d'una regulació més concreta sobre l'ús d'obres protegides en l'entrenament de models d'intel·ligència artificial, després de l'aprovació recent d'un informe sobre la qüestió
Contingut relacionat: Luis Ignacio, expert en propietat industrial: "Al Mobile, els infractors són retirats en hores”
Sant Jordi concentra cada any un fort pols comercial que reforça el protagonisme del sector editorial, amb signatures, cues i novetats que mantenen el llibre al centre de l'escena. Però l'auge de la intel·ligència artificial (IA), cada cop més estesa, introdueix un nou front de debat: l'ús de llibres per entrenar models d'aquesta tecnologia.
El Centre Espanyol de Drets Reprogràfics (Cedro) ja ho posava sobre la taula el passat juliol, en alertar que prop de 50.000 llibres, d'uns 41.000 autors espanyols, podrien haver-se utilitzat sense permís per desenvolupar models d'IA.
Afectats
L'alerta partia de l'informe de l'associació danesa Rights Alliance, que apuntava a grans tecnològiques per extreure continguts protegits des de webs pirates, com Library Genesis (LibGen).
Entre els potencials afectats, es trobaven noms com Arturo Pérez-Reverte, María Dueñas, Almudena Grandes, Fernando Aramburu o Eduardo Mendoza, així com les editorials Planeta,Anagrama i Acantilado.
Postura
Des de Cedro assenyalen que el problema ve d'un marc legal "insuficient" i d'anys d'inacció institucional, cosa que hauria debilitat la protecció dels drets d'autor.
En la mateixa línia, la Federació de Gremis d'Editors d'Espanya ha denunciat reiteradament que el sector fa temps que pateix un ús indegut dels seus continguts i que l'impacte de la IA és especialment greu dins dels canvis tecnològics recents.
Normativa
En qualsevol cas, el marc actual presenta certes limitacions, per la qual cosa no és possible afirmar que l'entrenament de la IA generativa sigui il·legal a Europa.
Violeta Arnaiz, directora de Propietat Intel·lectual, IA i Programari a Pons IP, explica que, en principi, qualsevol reproducció d'una obra protegida requereix l'autorització de l'autor i que l'entrenament de la IA implica, en la pràctica, fer “còpies” dels materials utilitzats.
Excepció legal
Existeix, però, una excepció important en la normativa europea: la mineria de textos i dades (TDM, per les seves sigles en anglès), que permet utilitzar i reproduir continguts protegits quan l'objectiu és analitzar grans volums d'informació per identificar patrons o correlacions.
"Tot i que aquesta excepció és prèvia a l'auge i popularització de la IA i no estava inicialment pensant-se en això, la veritat és que els actes d'entrenament de models d'IA s'encaixen en la definició", explica Arnaiz.
Façana de la Llibreria Sant Jordi (recurs)
Exclusió
Ara bé, quan l'ús té una altra finalitat, com l'entrenament de models de llenguatge (LLMs), es pot fer sense autorització sempre que els autors no hagin reservat expressament la seva oposició.
"El problema és la indefinició sobre la manera en què s'ha de formular aquesta reserva, a més, és clar, dels usos fets amb anterioritat, ja que abans de 2022 la IA encara no era coneguda pel gran públic i aquest mecanisme de reserva de drets pràcticament no s'utilitzava", afegeix l'experta en propietat industrial.
Protecció d'obres
La protecció de les obres passa per la reserva de drets, que obliga a obtenir llicència per al seu ús, i es pot reforçar amb eines tecnològiques que dificultin el web scraping, és a dir, l'extracció automatitzada de dades de llocs web mitjançant bots.
A la Unió Europea també s'estudia canalitzar la gestió de llicències i la seva remuneració a través d'entitats col·lectives, recorda Arnaiz.
Transparència
Cal tenir en compte que els grans models de llenguatge es desenvolupen sobretot als Estats Units i operen sota una normativa diferent de l'europea.
Tot i així, el reglament europeu d'IA ja avança exigències de transparència, inclosa l'obligació de documentar les seves fonts d'entrenament.
Context
El 2024, Brussel·les va donar llum verda a la seva primera gran regulació sobre IA, el desplegament de la qual avança de manera progressiva des de l'any passat. Tanmateix, la mateixa Comissió Europea ha reconegut les dificultats d'aplicació, per la qual cosa ha deixat oberta la possibilitat d'endarrerir els terminis, si les empreses no arriben a temps per complir amb les seves obligacions.
En paral·lel a això, a Espanya, el Ministeri de Cultura va retirar a començaments de 2025 la tramitació d'un decret que buscava regular les llicències d'ús d'IA, després de no assolir-se un consens entre els diferents actors implicats.
'Informe Voss'
En aquest context, el debat s'ha anat desplaçant cap a noves propostes. El mes passat el Parlament Europeu va aprovar --amb àmplia majoria-- l'informe sobre drets d'autor i IA generativa (el denominat col·loquialment 'Informe Voss'). Tot i que no té caràcter vinculant, sí que marca una línia política clara a Brussel·les, en plantejar la necessitat d'una regulació més específica sobre aquesta qüestió.
La seva proposta és crear un sistema europeu de llicències basat en acords col·lectius per sectors, gestionats a través d'entitats de drets i la EUIPO (Oficina de Propietat Intel·lectual de la Unió Europea).
El document busca un equilibri entre protegir els autors amb una compensació per l'ús de les seves obres en l'entrenament de la IA i, alhora, oferir a les empreses tecnològiques una via legal i estructurada per accedir a grans volums d'informació.