Posso vendere i testi generati da ChatGPT?
Se scrivo un testo con ChatGPT o creo un’immagine con Stable Diffusion, posso usarli o addirittura venderli? Parto dal presupposto che il diritto d’autore è un argomento complesso e in continua evoluzione, soprattutto nel contesto delle nuove tecnologie: basti pensare alla disputa tra Google e gli editori per quanto riguarda il servizio Google News. Con l’avvento dei modelli di linguaggio di apprendimento automatico, come GPT-3 di OpenAI o Alpaca dell’Università di Stanford, si pongono nuove questioni riguardanti la proprietà intellettuale. Possono una macchina o un algoritmo essere titolari di diritto d’autore? Chiarisco subito un fatto: secondo la Legge, sia anglosassone che europea, per avere diritto d’autore un’opera deve essere creata da un essere umano. Un po’ quello che successe nel caso del “Monkey selfie”: vale la pena raccontarlo.
Il caso dell’“autoscatto del macaco” finì sui giornali nel 2011 quando un macaco indonesiano scattò una serie di fotografie a se stesso con la macchina di un fotografo britannico. Le foto divennero virali, ma sollevarono anche questioni legali sulla proprietà dei diritti d’autore. Il fotografo, David Slater, rivendicò i diritti sulle foto, sostenendo che la macchina fotografica era sua e che l’aveva impostata correttamente lui. Tuttavia, alcune organizzazioni per la difesa dei diritti degli animali hanno sostenuto che il macaco, chiamato Naruto, doveva essere riconosciuto come il legittimo autore degli scatti. Era stato lui a fare clic! Dopo una lunga battaglia legale, nel 2018 è stato raggiunto un accordo tra le parti coinvolte, stabilendo che i diritti d’autore delle foto appartenevano a Slater, ma i proventi generati sarebbero stati destinati alla salvaguardia delle scimmie nel loro habitat naturale. Il caso del “monkey selfie” ha sollevato importanti questioni sulla definizione legale di autore e sul rapporto tra gli esseri umani e gli animali nel contesto dei diritti d’autore.
Gli output di un LLM non sono generati né da uomini né da scimmie: sono opera di una macchina, di un algoritmo, di un’intelligenza artificiale. La questione è dirimente: è l’utente che fornisce l’input al modello il detentore del diritto d’autore, o è l’organizzazione che ha creato e addestrato il modello? O forse, dato che l’output è generato da una macchina, non può essere protetto dal diritto d’autore? Sapendo che su queste questioni ChatGPT non è affidabile, vale la pena affidarsi al sito di OpenAI. Dove, nelle FAQ, si legge:
Chiaro: l’output è tuo, è di chi fa il prompt! Ecco perché Amazon è già pieno di libri “scritti” da ChatGPT. In verità, per essere precisi: “Oggi non esiste una norma che definisca direttamente e univocamente chi sia l’autore di un’opera generata da una intelligenza artificiale”.
Quindi tutto chiaro: tu fai l’input e tu sei il titolare del diritto d’autore, giusto? Sì, ma la questione è ancora più complessa. Serve riportare questa notizia: “Getty Images ha citato in giudizio l’intelligenza artificiale che usa le sue foto”. In pratica, Getty Images, l’agenzia fotografica di fama mondiale, ha citato in giudizio Stability AI, la società dietro lo strumento di intelligenza artificiale generativa Stable Diffusion, per presunta violazione del copyright. Getty sostiene che Stability AI ha copiato ed elaborato illegalmente milioni di immagini protette da diritto d’autore per “educare” la sua IA. In effetti alcune immagini di output addirittura riportavano il logo di Getty Images alterato.
Questo solleva nuove questioni legali tra le società di AI e i creatori di contenuti. Naomi Klein, autrice di “No logo”, sostiene che “davanti ai nostri occhi le aziende più ricche della storia (Microsoft, Apple, Google, Meta, Amazon) stanno mettendo le mani su tutta la conoscenza umana disponibile gratuitamente in digitale e la stanno utilizzando per scopi privati, rinchiudendola in prodotti di loro proprietà. Molti dei quali danneggeranno le persone che, senza dare il consenso, hanno addestrato le macchine con il lavoro di una vita”.
Quindi, il copyright non c’è sull’output, ma dovrebbe esserci sull’input, il cosiddetto “dataset”. Per esempio, la già citata Stability AI, per la sua AI “Stable DIffusion”, usa un dataset che si chiama LAION 5B, fornito sotto il principio del “fair use” accademico dalla società non profit LAION. Questo dataset si compone di cinque miliardi di immagini di qualsiasi tipo (foto, disegni, documenti di vario genere) raccolte con uno “scraping” dalla rete.
Notizia di questi giorni: Google ha aggiornato la sua policy sulla privacy, affermando esplicitamente di riservarsi il diritto di raccogliere praticamente tutto ciò che si pubblica online per addestrare i suoi strumenti di intelligenza artificiale. Questo significa che qualsiasi cosa si pubblichi online finisce nel dataset per il training di un chatbot.
Per questo qualcuno ipotizza che in futuro i LLM saranno addestrati su contenuti legittimamente “comprati” dagli autori o quantomeno occorrerà trovare un meccanismo di remunerazione di giornalisti, blogger, case editrici e titolari di diritto d’autore dei contenuti online (e non solo). Qualcosa si sta già muovendo. La European Guild For Artificial Intelligence Regulation, un’organizzazione che riunisce professionisti di vari settori creativi, propone l’introduzione del “training right” per regolare l’uso dei dati e delle opere creative da parte delle società di IA. Questa proposta implica che l’utilizzo dei dati deve avvenire all’interno di un sistema di licenza d’uso con modalità e termini di utilizzo che devono essere definiti in accordo fra le parti. L’obiettivo è di intervenire sulla proposta di regolamento della Commissione Europea chiamato AI ACT, che inizialmente ignorava le implicazioni di queste applicazioni nel mondo della creatività.
Scrivimi per organizzare un evento o un corso sull’intelligenza artificiale generativa
Scrivimi mandami un WhatsApp al 339.6325418 per organizzare un corso o una conferenza sull’A.I. generativa.
Lascia un Commento
Vuoi partecipare alla discussione?Fornisci il tuo contributo!