Articoli

L’arte di creare immagini con l’intelligenza artificiale: l’intervista a Paolo Dalprato

, ,

Ho conosciuto Paolo Dalprato online: non ci siamo (ancora) incontrati di persona. Un commento su LinkedIn, un messaggio su Messenger e così via. La sua attività di fotografo innamorato dell’intelligenza artificiale mi ha subito colpito: non solo per la competenza, ma anche per l’ardire di un professionista che, in apparenza, senza seguire il branco, non sbraita contro l’intelligenza artificiale che ruba lavori e annienta interi settori, bensì studia e sperimenta e divulga. Del resto, se addirittura un colosso che vende foto online come Shutterstock ha lanciato una piattaforma per la generazione di immagini da input testuale, vuole dire che qualcosa sta davvero cambiando.

Paolo, laureato in Fisica, dopo una vita da dipendente in una multinazionale delle telecomunicazioni, dieci anni fa inizia l’attività di fotografo professionista. Da sette anni sviluppa tour virtuali e, di recente, anche mappe interattive. Con l’annuncio di OpenAI dell’apertura al pubblico di Dall-E ha scoperto il mondo delle intelligenze artificiali che generano immagini e si è appassionato. Così ha aperto un blog: https://ai.paolodalprato.com, dove si può ammirare una galleria delle sue opere digitali.

Ho contattato Paolo per una chiacchierata virtuale su A.I. generative, sintesigrafia, strumenti come MidJourney e Stable Diffusion, opportunità e minacce per chi scatta foto per professione. Buona lettura!

Ciao Paolo, iniziamo da una domanda “scomoda”. Nell’immaginario collettivo un artista, un professionista delle immagini, dovrebbe avere paura delle AI generative. Perché tu no?

Ciao Gianluigi e grazie per l’invito. La domanda non è per nulla scomoda. È vero che sono un professionista, un fotografo per la precisione. Ma sono anche un gran curioso di cose tecnologiche e mi sono appassionato subito a questa strana cosa esplosa pubblicamente lo scorso anno.

Sono convinto che la mia categoria sarà pesantemente toccata dall’arrivo delle Intelligenze Artificiali generative. Anzi comincia a esserne già toccata, magari non direttamente chi fa gli scatti, ma la filiera (in questo caso chi si occupa della postproduzione) è già interessato da imagen-ai.com, un service per chi usa Lightroom che promette di elaborare 1500 immagini in meno di 10 minuti con il tuo stile e a costi bassissimi. Molto utile per chi si occupa di eventi, con migliaia di scatti da lavorare al ritorno in studio.

Ecco come funziona:

Ma anche chi fa ritratti comincia ad essere toccato, ad esempio c’è profilepicture.ai, un service online in grado di fornire fino a 900 ritratti di una persona di buona qualità in qualsiasi stile per soli 25 dollari: basta inviare 20 ritratti qualsiasi del soggetto.

E ho già visto un album di matrimonio creato con una qualche AI: brutto, ma l’hanno fatto!

Come reagiscono i tuoi colleghi?

Alcuni colleghi reagiscono male, altri la usano già coscientemente, la maggioranza sembra in attesa di capire che succederà. Da professionista so che non c’è possibilità di competere quando si ragiona sul costo e sui tempi di lavoro, ma sono convinto che la fotografia non sparirà. Gli appassionati continueranno a portare avanti la loro passione. I professionisti dovranno ripensare la propria attività: secondo me, potrebbe risultare vincente puntare su quello che le Intelligenze Artificiali non possono dare, cioè autorialità e contatto umano. Che si traduce nel fare diventare il servizio fotografico un’esperienza, cosa in cui sono bravi i matrimonialisti ad esempio.

Ricapitolando: perché non ti fa paura?

Per tre motivi. Il primo è che non posso farci niente, le AI ci sono e saranno sempre più presenti, devo considerarlo un dato di fatto e dei dati di fatto non ha senso avere paura (caso mai bisogna reagire, ma è cosa diversa dalla paura).

Il secondo: anche da appassionato, cerco di capire se posso in qualche modo fare entrare questa tecnologia nei servizi che offro, sia da fotografo sia da “esperto di AI”, da capire cosa potrebbe voler dire e come monetizzarla.  E l’unico modo che ho per capire se posso farlo e imparare a usarla.

L’ultimo. Chi l’ha detto che un’immagine debba essere creata con le AI oppure con la fotografia? Ho iniziato a vedere creativi che uniscono i due linguaggi: partono da una foto e la modificano con le AI, oppure creano un’immagine di partenza con le AI e la modificano con i tool che vengono usati normalmente dai fotografi.

Insomma… “Si può fare!” (cit.)

Come si legge sul tuo blog, questa nuova arte potrebbe chiamarsi “sintesigrafia”. Che cos’è e che cosa ti affascina di più di questo (nuovo) mondo?

Lo vedo come l’incontro (scontro?) fra le due intelligenze: quella umana e quella della macchina.  Le AI sono uno strumento potente e con una notevole autonomia creativa, ma come diceva una vecchia pubblicità la potenza è nulla senza controllo ed è la parte umana che deve esercitarlo. Potrebbe sembrare una lotta. La vedo invece come una possibilità di collaborazione, la parte umana mette in campo la progettualità, quella artificiale la potenza.

L’uso delle IA può anche diventare un ottimo test sulla creatività umana, specie quando si usa uno strumento come Midjourney che sembra invitare a formulare solo i concetti quando si fanno le richieste, tanto poi è MJ che pensa a rendere WOW il risultato.

Provo a dirlo in modo diverso, con MJ anche se formulo una richiesta stramba e minimale (ad esempio un elefante sullo skateboard) le impostazioni di default sono tali da garantire quasi sempre un’immagine capace di colpire, mentre con Stable Diffusion le cose sono diverse già dal modo in cui si fanno le richieste che devono essere più precise e dettagliate.

In effetti il termine sintesigrafia descrive molto bene questo lavoro collaborativo, anche se in realtà è derivato dalla tecnica di come vengono generate le immagini. Non credi?

Certo! Ma veniamo al tema spinoso del diritto d’autore: se il celebre “selfie monkie” non poteva essere della scimmia, perché il diritto è antropocentrico, di chi sono le opere generate dall’intelligenza artificiale?

La mia opinione personale assolutamente non da legale: dipende. Come ho detto nella risposta precedente, l’immagine che viene generata per me è sempre conseguenza dell’interazione delle due parti, l’umana e l’artificiale. La legge, parlo proprio dall’art. 1 della Legge n. 633/1941, dice che sono protette le opere d’ingegno di carattere creativo, la stessa legge distingue fra opere creative e non creative. La dico semplice, se la generazione dell’immagine è demandata di fatto alla AI, insomma se il prompt è un elefante sullo skateboard, penso sia da considerare della macchina perché non credo che una richiesta così “minimalista”  basti per farla considerare un atto creativo della persona. Se invece l’immagine è il risultato di un lavoro creativo, fatto di più interazioni, di aggiustamenti del prompt e dei parametri, insomma se l’umano cerca di usare la macchina per arrivare alla sua (dell’umano) immagine, allora questa è della persona.

Approfitto per una considerazione su un argomento che vedo in qualche modo collegato, ho letto di polemiche sulla possibile partecipazione di immagini generate da AI a concorsi fotografici, credo iniziate dopo la notizia su “Space Opera Theater” di Jason Allen, promosse soprattutto da NO-AI (sì, esistono). Devo dire che sono d’accordo: è corretto che immagini generate da AI non partecipino a concorsi fotografici (l’opera citata è un caso particolare, infatti il premio è stato confermato), così come le fotografie non partecipano ai concorsi di pittura e viceversa. Allo stesso tempo, quando inizieranno i concorsi specifici per le AI, le fotografie non dovrebbero essere incluse. Ho scritto quando, non se, perché sono convinto che presto o tardi ci sarà lo sdoganamento. Si comincerà a parlare di AI-Art anche nei circuiti delle gallerie e dei critici. Ho in mente l’esempio dei graffiti, che sono brutti, infantili, sporcano e così via. Poi sono arrivati Haring e Banksy, giusto per fare i primi due nomi che mi vengono in mente, e ora si fanno le mostre in luoghi fantastici. Per esempio, si è appena chiusa una mostra di Haring nella Villa Reale di Monza, pensa un graffittaro ospite d’onore in una reggia!

Forse l’attività più importante, in futuro, sarà quella di interrogare questi oracoli: si parla di “prompt engineering”. Puoi dare qualche dritta per ottenere immagini di alta qualità?

Ho già iniziato a vedere offerte di posti di lavoro per prompt engineeer con stipendi molto interessanti. Si parla molto di questo perché il prompt è comune a tutte le AI generative (non solo di immagini),  ma penso sarà uno dei lavori.

Per ottenere immagini di qualità, partire dal capire la struttura del prompt e quali sono i parametri. Parlando di Midjourney, probabilmente la più diffusa per chi inizia, sarebbe buona regola leggersi la documentazione ufficiale (questo il paragrafo sui prompt https://docs.midjourney.com/docs/prompts).

Per me un ottimo sito è questo: https://prompterguide.com. L’autore fornisce sia una guida un po’ più approfondita della documentazione originale (nel menu cliccate VISUAL NOTEBOOK), sia un tool per costruire il prompt (cliccate PROMPTER BUILDER).

Infine un esercizio che trovo molto utile è partire da un prompt molto complesso che genera un’immagine che ci piace e provare a togliere un elemento per volta. In questo modo si può capire cosa fanno e quanto pesano le singole parti.

Chiudiamo con gli strumenti, anche se ne hai già citati un paio davvero interessanti. Quali usi tu e quali consigli di provare a chi vuole sperimentare?

Da sempre sono un fan dell’open source. Lo sono anche in questo campo: infatti ho installato sul mio computer Stable Diffusion. Non sono però un fan acritico, uso i software open source quando penso siano almeno equivalenti a quelli proprietari. Nel caso delle AI sono dell’idea che Stable Diffusion sia un gran bel progetto, attorno a cui s’è creato un intero ecosistema, non solo di prompt engineeer ma anche di sviluppatori di interfacce, di extension e di modelli.

Perché uso Stable Diffusion? Perché è una sfida, perché mi permette di capire meglio come funziona una AI, perché escono continuamente cose nuove da provare e raccontare, perché serve per fare capire cosa sia davvero l’open source, perché mi diverto, perché mi permette di scegliere.

Stable Diffusion è tutto questo: lo consiglio a chi vuole capire il meccanismo. A chi invece interessa solo l’immagine, il mio suggerimento è MidJourney, rimanendo attenti ai nuovi attori che certo si presenteranno sul mercato. Anche con MidJourney si può sperimentare, vedo già creativi lavorare secondo l’approccio del progetto, non immagini singole o poco più, ma risultati di ricerche.

Restando su Stable Diffusion, ho visto che online vi sono diverse interfacce. Quale preferisci?

L’interfaccia che preferisco è AUTOMATIC1111: quella più completa, personalizzabile, flessibile, modulare. Insomma le ha tutte, compresa l’essere complessa. Ha senso usarla quando si vogliono testare modalità di lavoro e plugin vari. Se invece si è interessati alla generazione delle immagini, consiglio Invoke AI oppure Easy Diffusion.

È un mondo che evolve in modo rapidissimo, tenersi informati è obbligatorio ed anche un po’ stressante, perché ci si rende conto di quante cose non si riusciranno a provare! È una battuta, ma per me con un fondo di verità, ogni giorno leggo di aggiornamenti e novità e vorrei provarle tutte.

A proposito, vuoi chiudere con un messaggio di speranza?

Prima mi chiedevi di quale sarà il lavoro più importante, penso che l’approccio open source di Stable Diffusion permetterà lo sviluppo di professionalità diverse: alcune più esposte al pubblico, altre più defilate ma non meno importanti. Un’ipotesi che mi viene in mente: lo sviluppatore di modelli custom per le aziende, con lo scopo di generare immagini di prodotti specifici ambientati in modo altrettanto specifico. Probabilmente anche costuire dataset potrebbe diventare una nuova attività: le esigenze cominciano ad affinarsi ed esistono già dataset costruiti pensando a usi particolari, già oggi si può utilizzare il Cityscapes Dataset, costruito pensando allo sviluppo delle auto a guida autonoma. Ma anche professioni con una lunga storia saranno costrette a rinnovarsi, giusto un esempio pensa chi si occupa degli aspetti legali. Davvero la rivoluzione che stanno portando le Intelligenze Artificiali si sta allargando in modo impetuoso!

Lo spettacolo “Dante nel metaverso”

Guarda la registrazione del mio evento del febbraio 2023: