Le case editrici denunciano Meta: accuse di plagio su vasta scala

Recentemente, alcune delle più prestigiose case editrici, tra cui Macmillan, McGraw Hill, Elsevier, Hachette e Cengage, insieme allo scrittore Scott Turow, hanno avviato una causa contro Meta, accusando la società di aver plagiato libri e contenuti accademici praticamente parola per parola. L’azione legale solleva questioni importanti sul diritto d’autore nell’era dell’intelligenza artificiale e potrebbe avere ripercussioni significative su tutto il settore.

La questione del plagio nelle AI

L’accusa principale è che Meta abbia utilizzato libri e articoli accademici scaricati da noti siti di pirateria, come LibGen e Sci-Hub, per addestrare il suo modello Llama. I querelanti sostengono che il risultato di questo processo sia a dir poco preoccupante: quando si forniscono alcune frasi di un manuale, come quello di James Stewart, “Calculus: Early Transcendentals”, Llama restituisce il contenuto esatto, senza alcuna forma di parafrasi o rielaborazione. Questo utilizzo di materiali protetti da copyright è descritto come una delle violazioni più gravi mai registrate nel campo.

Meta è già stata coinvolta in controversie simili in passato. Una decisione di un giudice federale ha chiarito che non si può considerare legale l’utilizzo di materiale protetto per l’addestramento dei modelli, sebbene alcune cause abbiano cercato di giustificare l’uso di dati legali. Il caso di Anthropic, ad esempio, ha visto la società affrontare guai legali simili, con un giudice che ha stabilito che l’addestramento su contenuti legittimamente acquistati può rientrare nel “fair use”, ma ha anche consentito che si procedesse con una class action per le opere presuntamente piratate.

L’impatto sul settore dell’AI e oltre

Meta ha risposto alle accuse attraverso il suo portavoce, Dave Arnold, affermando che l’AI porta innovazione e produttività e che combatteranno la causa con determinazione. Tuttavia, le case editrici stanno chiedendo non solo un risarcimento danni, ma anche il blocco di qualsiasi attività considerata illegale. Un elemento centrale della loro richiesta è che Meta sia costretta a fornire l’elenco completo di tutte le opere utilizzate per addestrare Llama.

Questa situazione è particolarmente rilevante anche per il mercato italiano. Le case editrici italiane, già vulnerabili in un contesto di crescente digitalizzazione e pirateria, potrebbero subire le conseguenze di un precedente legale che potrebbe restringere ulteriormente le loro possibilità di protezione. Le aziende che operano nel campo dell’AI in Italia, così come quelle che si occupano di pubblicazione, devono prestare attenzione a come queste questioni legali si evolveranno.

Conclusione: uno scontro cruciale per i diritti d’autore

Il caso contro Meta non è solo una battle legale tra grandi nomi del settore; rappresenta un momento cruciale per definire i confini del copyright nell’era digitale. La possibilità che Meta venga costretta a rivelare le opere utilizzate nell’addestramento dei suoi modelli potrebbe avere ripercussioni importanti non solo per altre aziende tech ma anche per il panorama dell’editoria e della pubblicazione globale, inclusa quella italiana. Di fronte a un uso sempre più pervasivo di dataset provenienti dalla rete, l’epilogo di questa causa potrebbe delineare un nuovo modo di considerare i diritti di proprietà intellettuale nel contesto delle nuove tecnologie.