All'improvviso, nel minuscolo paesino di Weldborough, 33 abitanti, si sono presentati decine di turisti che chiedevano come raggiungere le terme.
Per addestrare la sua intelligenza artificiale, l’azienda Anthropic avrebbe comprato, scansionato e poi distrutto due milioni di libri usati
L'azienda avrebbe approfittato di un cavillo legale e sostiene di avere tutto il diritto di usare in questa maniera libri che ha regolarmente acquistato.
È cosa nota che le cosiddette intelligenze artificiali – in realtà sarebbe più corretto parlare di LLM, large language model – debbano elaborare continuamente una immensa quantità di informazioni. Una necessità che ha portato molte aziende del settore AI a muoversi nella zona grigia tra legalità e illegalità pur di procurarsi sempre nuovo materiale, in barba a copyright e tutela del diritto d’autore.
Nessuno però era ancora arrivato a comprare milioni di libri usati per “acquisirne” i testi e poi, una volta dati questi testi in pasto all’AI, distruggerne le copie fisiche da cui quei testi erano stati estratti. È proprio questa l’ultima accusa mossa all’azienda Anthropic (creatrice dell’intelligenza artificiale Claude), finita al centro di una nuova controversia dopo la diffusione di documenti giudiziari che rivelano una pratica, ribattezzata Project Panama, finora rimasta sotto traccia. Per addestrare i propri modelli linguistici, infatti, l’azienda avrebbe acquistato più di due milioni di volumi dal mercato dell’usato.
A ricostruire tutta la vicenda è Literary Hub, che ha riassunto due inchieste sulla questione del Washington Post e di Futurism. Secondo quanto emerso, i libri sarebbero stati comprati (in enormi quantità, l’ipotesi è che il numero vada da un minimo di 500 mila a un massimo di due milioni) da rivenditori dell’usato, successivamente privati delle rilegature e scansionati pagina per pagina da una ditta specializzata, per poi essere spediti al macero. Questo procedimento, apparentemente contorto, sarebbe in realtà una maniera, in verità piuttosto ingegnosa, di approfittare di un cavillo legale emerso da un altro processo ai danni di Anthropic, uno in cui l’azienda era stata citata in giudizio appunto per violazione di copyright per aver usato materiali protetti dallo stesso per addestrare la sua AI, scaricandoli illegalmente da piattaforme come LibGen e PiLiMi.
Il giudice di quel processo si era prodotto in un’interpretazione della legge piuttosto originale. In breve: secondo il giudice, un’azienda AI può usare i libri per addestrare una intelligenza artificiale purché usi questi libri in maniera “trasformativa”. Cosa intendessi il giudice con la parola trasformativa non è chiaro, ma ciò che è chiaro è che secondo lui, a queste condizioni, e previo aver ottenuto il libro con mezzi leciti (l’acquisto, quindi) l’uso di materiale protetto da copyright sarebbe accettabile, paragonabile al lavoro di un insegnante che impiega un libro per istruire una classe. Come si sia arrivati da questo a due milioni di libri usati mandati al macero, questo nemmeno la più avveniristica delle AI riuscirebbe a spiegarlo.
La difesa di Anthropic, che non ha potuto negare la pratica, ha poi peggiorato la situazione. L’azienda sostiene infatti che l’acquisto legale dei volumi cartacei consentirebbe l’uso dei testi al loro interno. Una linea difensiva che però non convince diversi osservatori ed esperti, per i quali la distruzione di milioni di libri rappresenta un passaggio ancor più inquietante: dalla digitalizzazione aggressiva e senza permesso alla cancellazione fisica del patrimonio culturale in nome dell’addestramento algoritmico. I detrattori dell’AI inoltre sottolineano come sia l’ennesimo esempio di fino a che punto alcune aziende siano disposte a spingersi pur di alimentare i propri modelli, calpestando e depredando il lavoro altrui.
È il primo sciopero del settore nel nostro Paese, ma la discussione va avanti da tempo, casi simili ci sono stati negli Usa e in Francia. Tra sindacalizzazione, proteste, licenziamenti e inchieste giornalistiche.
All'improvviso, nel minuscolo paesino di Weldborough, 33 abitanti, si sono presentati decine di turisti che chiedevano come raggiungere le terme.