Articoli

Corso di prompt engineering

Qualche tempo fa mi sono imbattuto in questo articolo:

Non sono d’accordo: il prompt engineering, l’arte di interrogare le intelligenze artificiali, non sarà un lavoro, bensì una competenza. E qui viene il bello: una competenza mai vista.

Tra hard e soft skill

Fino a oggi abbiamo sempre diviso le competenze tra hard skill e soft skill. Tra le prime mettevamo le abilità tecniche che si applicano a mansioni e compiti specifici, per esempio saper usare Excel. Per soft skills, invece, intendevamo abilità interpersonali che possono essere trasferite a diversi tipi di lavoro e situazione, come la capacità di saper lavorare in team. Ora invece si parla di qualcosa di inedito: un ibrido. Dobbiamo sapere utilizzare degli strumenti informatici, i cosiddetti modelli di linguaggio LLM (questa è una soft skill) ma con la capacità di saperli interrogare, correggere, stimolare e così via. Ma queste sono competenze comunicative, addirittura relazionali! Quindi hard e soft skill si mischiano nel prompt engineering.

Faccio un esempio. Il paper scientifico intitolato “Large Language Models Understand and Can be Enhanced by Emotional Stimuli” esplora la capacità dei grandi modelli linguistici (LLM) di comprendere gli stimoli emotivi. Gli autori hanno condotto esperimenti su vari LLM (come Vicuna, Llama 2, BLOOM, ChatGPT e GPT-4) e hanno dimostrato che gli LLM hanno una certa comprensione dell’intelligenza emotiva e che le loro prestazioni possono essere migliorate con l’uso di “emotion prompt”, prompt che combinano il comando originale con stimoli emotivi. I risultati? Un miglioramento medio del 10,9% in termini di prestazioni, veridicità e metriche di responsabilità.

Il MIO corso di prompt engineering

Il corso può avere una durata variabile, a seconda delle esigenze dell’azienda o del professionista: durata minima 6 ore. Il corso, anzi: il workshop, mira a fornire una conoscenza approfondita dell’ottimizzazione delle interazioni tra gli utenti e i LLM (come ChatGPT, Bing, Bard, Claude, ecc.). L’obiettivo concreto? I partecipanti impareranno le tecniche e gli strumenti per creare prompt efficaci, migliorare l’accuratezza e l’utilità delle risposte generate dai modelli. Ovviamente saranno mostrati tanti casi di successo ma soprattutto occorre mettere in pratica tutto quello che si vede di volta in volta. I moduli previsti sono cinque.

Modulo 1
Introduzione al prompt engineering

Questo modulo introduce gli studenti ai concetti fondamentali del prompt engineering: intelligenza artificiale generativa, machine learning, deep learning, LLM, NPL, ecc.

Modulo 2
Etica e considerazioni legali

Questo modulo finale affronta le questioni etiche e legali relative all’utilizzo di LLM e al prompt engineering, inclusi privacy, copyright e la sicurezza.

Modulo 3
Creazione di prompt efficaci

In questo modulo, gli studenti impareranno come formulare prompt che portano a risposte più accurate e utili da parte dei modelli di lingua. In particolare ho sviluppato il mio modello cha si chiama “GOL”.

Modulo 4
Ottimizzazione e Testing

Questa parte del corso, la più laboratoriale, esplora le tecniche di ottimizzazione e testing dei prompt.

Modulo 4
Casi d’uso specifici e best practice

Il modulo copre vari casi d’uso specifici del prompt engineering, da applicazioni aziendali a progetti di ricerca, e discute delle migliori pratiche nel settore.

Che cosa dice chi ha già fatto il corso?

Scrivimi per organizzare un evento o un corso sull’intelligenza artificiale generativa

Scrivimi mandami un WhatsApp al 339.6325418 per organizzare un corso o una conferenza sull’A.I. generativa.

Inviaci email

“L’intelligenza artificiale segnerà una svolta epocale”: l’articolo sul Giornale di Merate

,

Il 29 settembre 2023, Canzio Dusi ed io siamo stati invitati da Netweek a una colazione di lavoro con una trentina di aziende e professionisti brianzoli.

Abbiamo parlato di molti temi: cos’è l’intelligenza artificiale generativa, perché ChatGPT ha avuto tanto successo, perché molti professionisti temono per il proprio lavoro, cosa possono fare le aziende per governare il cambiamento. Tutti temi che sono stati riassunti da questo articolo del Giornale di Merate:

intelligenza_artificiale_evento_netweek_verderio_29sett2023_articolo_Giornale_di_Merate

Il riassunto di ChatGPT

Per farvi capire le potenzialità dell’IA generativa, ho dato in pasto a ChatGPT  l’articolo ed ecco il suo riassunto.

L’articolo è piuttosto lungo e copre una vasta gamma di argomenti riguardanti l’intelligenza artificiale (IA) e il suo impatto sulla sfera professionale e privata. Ecco un riassunto dei punti chiave:

Contesto:
L’articolo discute un workshop organizzato dal Gruppo Netweek, che ha visto la partecipazione di vari stakeholder, tra cui imprenditori, rappresentanti di associazioni e esperti nel campo dell’innovazione tecnologica, come Canzio Dusi e Gianluigi Bonanomi.

Potenzialità dell’IA:
– L’IA è vista come una tecnologia rivoluzionaria che cambierà sia la sfera professionale che quella privata.
– Le aziende sono particolarmente interessate all’IA per ottimizzare il lavoro, liberando tempo dalle attività routinarie.

Pregi e Difetti:
– Mentre alcuni vedono l’IA come una svolta epocale, altri esprimono preoccupazioni e timori.
– È stato sottolineato che l’IA è già una realtà, con chatbot come Alexa e Siri che stanno diventando sempre più comuni.

Impatto Sociale:
– L’IA creerà nuovi posti di lavoro ma metterà a rischio alcune categorie, in particolare lavori ripetitivi o a basso valore aggiunto.
– C’è un bisogno urgente di regolamentazione e investimenti in formazione e sviluppo.

Futuro del Lavoro:
– La valutazione del lavoro si sposterà da un modello basato sul tempo a uno basato su obiettivi e qualità.
– Si prevede che l’80% delle professioni, soprattutto quelle intellettuali a basso valore aggiunto, sarà influenzato dall’IA.

Altri Punti:
– L’articolo menziona anche l’importanza della governance dell’IA e la necessità di un ripensamento complessivo dei processi aziendali.
– Viene citata la piattaforma Chat Gpt, che è utilizzata solo dal 19% della popolazione totale negli Stati Uniti, ma che ha un grande potenziale per migliorare la qualità dei processi lavorativi.

In sintesi, l’articolo sottolinea l’importanza crescente dell’IA e i suoi potenziali benefici, ma anche le sfide e le preoccupazioni che essa porta con sé.

Scrivimi per organizzare un evento o un corso sull’intelligenza artificiale generativa

Scrivimi mandami un WhatsApp al 339.6325418 per organizzare un corso o una conferenza sull’A.I. generativa.

Inviaci email

Camera dei Deputati: audizione sull’intelligenza artificiale di Gianluigi Bonanomi (3/10/23)

, ,

La Commissione Attività produttive della Camera dei Deputati, in merito all’indagine conoscitiva su “Intelligenza artificiale: opportunità e rischi per il sistema produttivo italiano”, ha svolto diverse audizioni. Questo il mio intervento:

Scrivimi per organizzare un evento o un corso sull’intelligenza artificiale generativa

Scrivimi mandami un WhatsApp al 339.6325418 per organizzare un corso o una conferenza sull’A.I. generativa.

Inviaci email

Perché consiglio (e sconsiglio) “L’era dell’intelligenza artificiale” di Kissinger, Schmidt e Huttenlocher

,

Tra i tanti libri che stanno uscendo sull’intelligenza artificiale, uno in particolare ha attratto la mia attenzione: “L’era dell’intelligenza artificiale. Il futuro dell’identità umana“. Soprattutto per le tre firme che ho visto in copertina.

    • Il centenario Kissinger è l’ex Segretario di Stato Usa
    • Schmidt è stato Ceo di Google
    • Huttenlocher è un decano del Massachusetts Institute of Technology

Il libro è un’indagine sulle implicazioni dell’intelligenza artificiale nella nostra società, e chiude con uno sguardo al futuro. Gli autori esplorano una vasta gamma di temi: dalla filosofia alla tecnologia, dalla sicurezza all’etica, per offrire una panoramica completa di come l’IA stia cambiando il nostro modo di vivere, pensare e interagire con il mondo.

Due esempi di innovazioni tecniche

Il libro inizia con esempi concreti di come l’IA ha già iniziato a rivoluzionare vari settori. Per esempio insiste molto sull’esempio di AlphaZero di Google DeepMind: un’IA che ha battuto Stockfish al gioco Go nel 2017, è stato in grado di farlo con solo quattro ore di auto-allenamento. Questo dimostra la capacità dell’IA di riconoscere modelli e generare mosse mai immaginate prima: mi ha molto colpito il caso del sacrificio della regina in una partita di scacchi, mossa strategica difficilmente percorribile per un umano.

Un altro esempio significativo è l’uso dell’IA nel campo medico. Nel 2020, il MIT ha scoperto un nuovo antibiotico, Halicina, in grado di sconfiggere ceppi batterici resistenti, grazie all’uso dell’intelligenza artificiale. Sorprendentemente, i ricercatori non sanno esattamente perché funzioni, il che solleva interrogativi sulla comprensione umana delle decisioni prese dall’IA.

Impatto sociale e filosofico

Gli autori puntano forte sulle implicazioni della rivoluzione IA. Sottolineano che, a differenza di altre innovazioni tecnologiche, l’intelligenza artificiale abbia il potenziale per trasformare la struttura sociale e politica. Non è solo un cambio di strumento, come passare dal cavallo all’automobile, ma una trasformazione radicale che influenzerà tutti gli ambiti dell’esperienza umana. L’IA pone domande fondamentali sulla natura dell’essere umano e sul nostro ruolo in un mondo sempre più dominato dalle macchine.

Perché leggerlo (e perché no)

Consiglio il libro per questi motivi:

  • “L’era dell’intelligenza artificiale e il nostro futuro” è un libro introduttivo, utile per chiunque sia interessato all’impatto dell’IA sulla società. Offre una panoramica abbastanza completa delle opportunità e delle sfide che questa tecnologia presenta, esplorando sia gli aspetti tecnici che quelli filosofici.
  • Si notano i diversi punti di vista degli autori: tecnologia, filosofia, sociologia, geopolitica, storia, ecc.
  • È sufficientemente breve e scorrevole.

Perché eviarlo:

  • È un libro molto basico. Eppure non costituisce una vera introduzione all’IA, presuppone che si conosca già il fenomeno.
  • A volte è prolisso, per esempio la parte su politica e cyberwar l’avrei ridotta alla metà.
  • È ripetitivo: l’esempio dell’halicina mi è uscito dagli occhi. Mi sarebbe piaciuto trovare molti altri esempi e casi di studio.

Scrivimi per organizzare un evento o un corso sull’intelligenza artificiale generativa

Scrivimi mandami un WhatsApp al 339.6325418 per organizzare un corso o una conferenza sull’A.I. generativa.

Inviaci email

Corso “ChatGPT e AI generativa per avvocati”

,

Titolo del corso: ChatGPT e AI generativa per avvocati

Durata: 6 ore (più eventuale follow-up)

Scenario

L’intelligenza artificiale e le sue applicazioni stanno rivoluzionando molti settori, tra cui quello legale. ChatGPT, un modello di IA generativa sviluppato da OpenAI, può essere un potenziale alleato per gli avvocati, offrendo supporto in vari compiti come la ricerca preliminare per cause o fusioni societarie. A patto di saperlo usare bene. L’uso di queste tecnologie non è esente da sfide e rischi.

Un esempio di uso problematico è il caso di Steven Schwartz, un avvocato dello studio legale Levidow, Levidow e Oberman, che ha utilizzato ChatGPT per la stesura di un documento legale a difesa del suo cliente Roberto Mata. Il documento, presentato in tribunale, conteneva informazioni fasulle, inventate di sana pianta dal chatbot di OpenAI (il tema è quello delle allucinazioni dei LLM). Nonostante Schwartz avesse chiesto rassicurazioni a ChatGPT sulla veridicità dei casi citati, il chatbot ha confermato che erano tutti reali, risultando poi inesatti. Questo ha portato a possibili sanzioni legali per l’avvocato.

Un altro caso simile è avvenuto negli Stati Uniti, dove un uomo ha citato in giudizio la compagnia aerea Avianca dopo essere stato colpito a un ginocchio da un carrello di metallo durante un volo. Gli avvocati dell’accusa hanno presentato un fascicolo contenente diversi casi analoghi avvenuti in passato, tutti frutto della fantasia di ChatGPT. Anche in questo caso, gli avvocati sono stati multati e il caso è stato archiviato.

Questi esempi evidenziano come l’intelligenza artificiale non sia ancora pronta per lavorare in completa autonomia. Gli strumenti di IA come ChatGPT hanno ancora bisogno della supervisione dell’uomo per funzionare correttamente, e soprattutto di competenze specifiche per la creazione dei prompt.

Il corso mira a fornire una comprensione chiara di come l’IA e ChatGPT stanno influenzando la professione legale e come utilizzarli in modo efficace e responsabile.

Obiettivi del corso:

  1. Comprendere le basi dell’Intelligenza Artificiale (IA) e di ChatGPT.
  2. Esplorare come l’IA sta rimodellando il mondo del lavoro, in particolare la professione legale.
  3. Capire come utilizzare ChatGPT e altri LLM come strumento di supporto nella professione legale.
  4. Discutere i rischi e i benefici dell’IA per la professione legale.
  5. Esaminare casi reali di applicazione di ChatGPT nel campo legale.

Temi del corso:

  1. Introduzione a ChatGPT e all’IA generativa: lo scenario.
  2. L’IA e il futuro della professione legale.
  3. Prompt engineering
  4. Utilizzo di ChatGPT nella pratica legale: ricerche preliminari, costruzione di difese, comunicazioni, marketing, ecc.
  5. I migliori plug-in di ChatGPT Plus per i legali
  6. Test di altri LLM: Bard, Bing, Claude, ecc.
  7. LLM e tool di AI per il marketing e la comunicazione dei legali (testi, immagini, video, ecc.)
  8. Rischi e benefici dell’IA per gli avvocati.
  9. Casi di studio: esempi di applicazione di ChatGPT nel campo legale.
  10. Workshop sull’uso dell’AI generativa per i legali.

Risultati attesi: Al termine del corso, i partecipanti avranno una comprensione chiara di come l’IA e ChatGPT stanno influenzando la professione legale. Saranno in grado di utilizzare ChatGPT come strumento di supporto nel loro lavoro e avranno una visione equilibrata dei rischi e dei benefici dell’IA per la professione legale.

Scrivimi per organizzare un evento o un corso sull’intelligenza artificiale generativa

Scrivimi mandami un WhatsApp al 339.6325418 per organizzare un corso o una conferenza sull’A.I. generativa.

Inviaci email

Percorso di formazione sull’AI generativa (10 incontri)

Ecco un possibile percorso formativo sull’intelligenza artificiale generativa, suddiviso in 10 appuntamenti da 3/4 ore ciascuno.

Scenario

Da decenni si parla di intelligenza artificiale, da anni di AI generativa. Ma è solo dalla fine del 2022, con l’esplosione della ChatGPT-mania, che molte aziende e professionisti hanno iniziato a interrogarsi su come potrebbe cambiare il mondo del lavoro. In questi primi mesi si è già visto come l’intelligenza artificiale travolgerà l’80% dei lavori e una vasta gamma di settori, dalla medicina alla finanza, dall’ingegneria al marketing, per non parlare dei mestieri creativi.

L’intelligenza artificiale generativa, in particolare i modelli di linguaggio come GPT-4 o PaLM, può creare contenuti originali, rispondere a domande, scrivere codice, tradurre lingue, fare brainstorming e analisi evolute, e molto altro ancora. Questo apre una serie di opportunità per i professionisti in termini di efficienza, creatività e personalizzazione. Per esempio, i lavoratori del marketing e della comunicazione possono utilizzare l’IA generativa per creare piani editoriali e contenuti personalizzati, migliorando l’engagement e la conversione. Per questo il corso affronta il tema dei contenuti sia dal punto di vista strategico (piano editoriale) che tattico (come creare diversi tipi di contenuti, compresi quelli multimediali). Inoltre, l’IA generativa può aiutare i professionisti a rimanere competitivi in un mercato del lavoro sempre più digitalizzato: per questo nel percorso è stato inserito un incontro anche sul personal branding. In generale, l’IA generativa può aiutare i professionisti a liberare tempo da compiti ripetitivi (per esempio rispondere a decine di email o creare grafici e slide) e a concentrarsi su attività più strategiche e creative. Questo non solo può migliorare la produttività, ma può anche portare a un lavoro più gratificante. Del resto, come si suol dire, non è l’intelligenza artificiale a rubare il lavoro, ma un professionista che la sa usare bene.

Il percorso è adatto a ogni professionista, dai C-level che vogliono comprendere il fenomeno AI ai lavoratori che vogliono capire come cambia il proprio lavoro da subito. Ogni appuntamento includerà una parte di spiegazione e una parte pratica, laboratoriale.

Materiale

Al termine di ogni lezioni i discenti riceveranno copia delle slide e spunti di approfondimento.

Il percorso in 10 appuntamenti

1. Introduzione agli LLM e all’intelligenza artificiale generativa

  • Panoramica dell’intelligenza artificiale generativa
  • Cos’è un LLM e come funziona
  • Prompt engineering
  • Problemi e limiti degli LLM
  • Casi di successo
  • Esercizio pratico: primi passi con un modello di linguaggio (es: ChatGPT)

2. Piano editoriale data-driven

  • Cos’è un piano editoriale e perché è importante
  • Come utilizzare i dati per informare il tuo piano editoriale
  • Strumenti di analisi dei dati per il content marketing
  • Esercizio pratico: creazione di un piano editoriale basato sui dati

3. AI Web Writing

  • Cosa differenzia la scrittura web da quella tradizionale
  • Come l’IA può migliorare la scrittura sul web (titoli, testi, cta, ecc.)
  • Strumenti di IA per la scrittura e la revisione dei contenuti
  • Esercizio pratico: utilizzo di LLM per la scrittura di un articolo, generazione di un prompt per la revisione dei articoli in ottica web writing

4. Digital Storytelling

  • Cos’è il digital storytelling: principi di base e tecniche più diffuse
  • Come l’IA può migliorare il digital storytelling
  • Esercizio pratico: creazione di una storia con l’aiuto dell’IA

5. Neuromarketing con l’intelligenza artificiale

  • Introduzione al neuromarketing
  • Come l’IA può essere utilizzata nella creazione di contenuti digitale e social grazie ai principi del neuromarketing
  • Esercizio pratico: creazione di contenuti con l’AI

6. Contenuti multimediali

  • Come l’IA può migliorare la creazione di contenuti multimediali
  • Strumenti di IA per la creazione e l’editing di foto e video
  • Esercizio pratico: utilizzo di un tool di IA per la creazione di un video

7. Presentazioni multimediali

  • I principi di base per fare una buona presentazione
  • Come l’IA può migliorare le presentazioni multimediali
  • Strumenti di IA per la creazione di presentazioni
  • Esercizio pratico: creazione di una presentazione con l’aiuto dell’IA

8. Personal Branding con l’AI

  • Come l’IA può aiutare a costruire e gestire il personal branding
  • Strumenti di IA per il personal branding
  • Esercizio pratico: utilizzo di un tool di IA per migliorare il profilo LinkedIn

9. Data Analysis

  • Introduzione all’analisi dei dati
  • Come l’IA può migliorare l’analisi dei dati
  • Strumenti di IA per l’analisi dei dati
  • Esercizio pratico: utilizzo di un tool di IA per analizzare un set di dati

10. Q&A

Sessione di domande e risposte per risolvere eventuali dubbi e approfondire gli argomenti trattati durante il corso.

Che cosa dice chi ha seguito il corso

Scrivimi per organizzare un corso sull’intelligenza artificiale generativa

Scrivimi mandami un WhatsApp al 339.6325418 per organizzare un corso (o una conferenza) sull’A.I. generativa.

Inviaci email

Google Bard: 5 cose che devi sapere prima di iniziare a usarlo

, ,

13 luglio 2023, sono da un cliente per un corso introduttivo sull’intelligenza artificiale. Si parla di ChatGPT e della novità del Code Interpreter, di Claude di Anthropic e i suoi 100.000 token di prompt, Elon Musk che vuole bloccare OpenAI ma sta facendo la sua AI… A un certo punto un partecipante chiede: “Ma quando sarà disponibile Google Bard  in Italia?”. Non so cosa rispondere, dico che era previsto entro la metà del 2023 (negli Usa era disponibile da marzo), ma che le regole privacy europee stanno allungando i tempi. Non si può fare una previsione. E invece, proprio in quei momenti, arriva la notizia: “Google Bard arriva in Italia!”

Ho deciso di scrivere subito una guida base, introduttiva, a Google Bard, il chatbot di Google basato sull’intelligenza artificiale (proprio come il celebre ChatGPT). Prima capiamo di cosa stiamo parlando. Partiamo dal nome, che significa “poeta”: è un diretto riferimento (shakespeariano) alla sua capacità di generare contenuti autentici e unici. Detto che è un assistente virtuale, un chatbot, a differenza dei competitor è basato sul modello PaLM 2 di Google. Si può accedere gratis a Bard, se maggiorenni, da bard.google.com: non serve registrarsi, ma se fai “log in” con il tuo account Google, avrai dei benefici che vedremo nel pezzo. L’assistente può parlare fino a 40 lingue diverse, italiano compreso.

1. Accesso al Web

Bard è pre-addestrato come gli altri Large Language Models (LLM), come ChatGPT, ma può anche navigare sul Web per accedere a notizie fresche (come ChatGPT Plus).

Bard non è però in grado di analizzare i siti Web come possono fare Bing Chat o Perplexity o linkare fonti:

Però Bard, essendo un giocattolo di Google, può integrarsi con il motore di ricerca. Quindi dopo ogni output si può far partire la ricerca online ma solo utilizzando le query che propone lui.

In teoria, Bard dovrebbe utilizzare la geolocalizzazione per fornire risposte più utili e pertinenti alla tua posizione. Ma, alla prova dei fatti, fallisce clamorosamente. Nonostante indichi correttamente la mia posizione in Brianza, poi mi dice che il cinema più vicino è a Udine. Mah.

2. Input e output

Come per tutti gli LLM, anche Bard richiede un prompt in input per funzionare (promette a breve di inserire immagini in input, cosa al momento non ancora possibile). Posto che ChatGPT accetta prompt da 4.000 token e Claude 2 da 100.000 token, qual è la “capacità” di Bard? Non è molto chiaro, perché Google non la esplicita. Ma da diverse prove di utenti in Rete, pare che si parli di 4.000 caratteri in input e 50.000 in output. Per quanto riguarda i risultati che si ottengono, a differenza dei competitor, il chatbot di Big G può anche “parlare” grazie alla sua funzione di sintesi vocale, disponibile in oltre 40 lingue. Gli output testuali, inoltre, possono essere condivisi con altri utenti.

3. L’integrazione con gli altri prodotti Google

Abbiamo già detto dell’integrazione tra Bard e Google (che tra l’altro in futuro sarà completa come in You.com), ma quello che risulta davvero interessante è il dialogo tra il chatbot e strumenti d’uso quotidiano come Gmail e Google Drive. Ogni output può essere inoltrato via mail, ma soprattutto può essere caricato sul cloud di Google sotto forma di documento o foglio di calcolo.

In questo esempio ho chiesto di creare una tabella con la filmografia di Tarantino e poi l’ho salvata su Drive sotto forma di foglio di calcolo.

Chiaramente la tabella risultante deve essere personalizzata (nome file, layout, ecc.):

4. Programmazione e formule

Altre funzionalità degne di nota includono la capacità di Bard di tradurre tra lingue ma soprattutto di supportare la programmazione in 20 linguaggi diversi (incluso Python, che può essere esportato e testato direttamente in Google Colab). Puoi chiedere a Bard di aiutarti con linguaggi come C++, Go, Java, JavaScript, TypeScript e persino con le funzioni di Fogli Google. Ho provato a chiedergli di separare nome e cognome in due colonne diverse.

 

5. La privacy

Come detto, il ritardo dell’arrivo in Italia di Bard era dovuto prevalentemente alle regole privacy restrittive. In termini di privacy, quando l’attività di Bard è attiva, Google memorizza nel tuo account per 18 mesi le attività (tra cui l’indirizzo IP o gli indirizzi di casa). Puoi disattivare l’opzione di eliminazione automatica o impostarla su 3 o 36 mesi qui:

Hai anche la possibilità di mettere in pausa il salvataggio delle conversazioni, come riportato nell’help. Anche quando l’attività di Bard è disattivata, le tue conversazioni verranno salvate nel tuo account per un massimo di 72 ore.

Scrivimi per organizzare un evento o un corso sull’intelligenza artificiale generativa

Scrivimi mandami un WhatsApp al 339.6325418 per organizzare un corso o una conferenza sull’A.I. generativa.

Inviaci email

Mi sono fatto un deep fake da solo: come mi sono clonato voce e immagine

, ,

Si parla da molto tempo di digital twin: il “gemello digitale” è una replica digitale di un oggetto, sistema o processo del mondo reale. O, se vogliamo, anche di una persona (in realtà il vero digital twin è praticamente autonomo) anche se in quel caso sarebbe più opportuno parlare di “second brain”.
Ora, con gli strumenti di intelligenza artificiale a disposizione di tutti, è possibile “clonarsi”, creare un avatar con la nostra faccia e la nostra voce, che fa e dice cose che non abbiamo mai fatto né detto. Rovescio della medaglia: i deep fake, vale a dire video o audio manipolati che utilizzano l’IA per creare l’illusione che determinate azioni o discorsi siano stati eseguiti da persone reali. Il termine “deepfake” è una combinazione di “deep learning” (un sottocampo dell’IA) e “fake”, che indica qualcosa di falso o ingannevole. Un esempio? Zelensky che si arrende a Putin.

Per comprende meglio il meccanismo, mi sono creato un deep fake da solo. Ecco come ho fatto, passo per passo.

Eleven Labs: generatore di Voci basato sull’IA

Prima di tutto dovevo clonarmi la voce. Per questo ho usato Eleven Labs: l’azienda newyorkese ha creato un modello generativo che consente di progettare da zero voci artificiali. In altre parole, è possibile generare voci personalizzate che non corrispondono a nessuna voce esistente. Oppure, ed è questo che ci interessa, è possibile dare allo strumento in pasto dei campioni della propria voce per “clonarla”, per generare una voce sintetica con stesse caratteristiche (estensione, timbro, intensità, tono, stile, ecc.). L’ho fatto. Ho preso 15 file audio contenenti la registrazione della mia voce e li ho dato in pasto all’algoritmo.

Una volta clonata la mia voce, sono passato alla sezione “Speech Synthesis” (in pratica “sintesi vocale”) e ho scritto il testo per l’avatar. Un testo breve, da 500 caratteri per un parlato da circa mezzo minuto. A quel punto il “text to speech” ha fatto il suo dovere e ho scaricato il file audio del mio parlato virtuale.

 

A quel punto mi serviva un avatar parlante.

D-ID.com: creazione di Avatar Realistici con AI

D-ID.com è una piattaforma Web che utilizza l’animazione facciale in tempo reale e il text-to-speech avanzato per creare esperienze di intelligenza artificiale conversazionale immersive, simili a quelle reali. Utilizzando D-ID, ho caricato una foto di me stesso (avrei potuto usare anche il mio avatar) e ho poi personalizzato la mia animazione caricando il file audio.

A quel punto non ho fatto altro che aspettare la magia. Dopo qualche minuto ho scaricato il video (un po’ “metallico”, ma interessante) con la mia immagine parlante e con le labbra del ritratto in sincrono con il parlato. Vuoi vedere l’effetto finale?

Il video del mio deep fake

Una volta scaricato il video da D-ID.com ho fatto un minimo di montaggio video, ed ecco il risultato:

Come ti sembra?

La combinazione di Eleven Labs e D-ID.com ha reso possibile la creazione del mio avatar parlante. Questi strumenti di IA non solo hanno ridotto i costi e il tempo necessario per la produzione video, ma hanno anche offerto una flessibilità e un controllo senza precedenti sul risultato finale. Con l’effetto “wow” dei video generati da IA, sono stato in grado di creare l’effetto wow!

 

Scrivimi per organizzare un evento o un corso sull’intelligenza artificiale generativa

Scrivimi mandami un WhatsApp al 339.6325418 per organizzare un corso o una conferenza sull’A.I. generativa.

Inviaci email

Intelligenza artificiale generativa: che cos’è Poe.com e 3 cose da sapere

,

Poe.com non è un sito dedicato al mitico Edgar Allan dei racconti dell’orrore, bensì è un acronimo che sta per:

  • Platform (for)
  • Open
  • Exploration

Si tratta di un servizio sviluppato da Quora e lanciato nel dicembre 2022.

Questa piattaforma permette agli utenti di porre domande e ottenere risposte da una serie di LLM (modelli di linguaggio di grandi dimensioni), il più celebre dei quali è certamente ChatGPT. Oltre al chatbot di sviluppato da OpenAI, è possibile provarne altri. In particolare Claude-instant e Claude+ di Anthropic eccellono nei compiti di scrittura creativa e forniscono risposte approfondite, mentre Sage e ChatGPT sono fenomenali in lingue diverse dall’inglese (ovviamente compreso l’italiano) e in compiti legati alla programmazione. GPT-4 eccelle nella scrittura creativa, nella risoluzione dei problemi e nel seguire le istruzioni.

Lato privacy, le conversazioni con i chatbot su Poe sono private e condivise solo a discrezione dell’utente. La versione Premium di Poe.com costa 19 euro al mese e consente di accedere a tutti i modelli. Per esempio, tra quelli disponibili si trovano diverse voci relative a ChatGPT, in particolare ChatGPT-16k e GPT-4-32k. Chi paga ha diritto inoltre a 600 messaggi GPT-4 e 1.000 messaggi Claude-2-100k al mese.

 

Ultima chicca: gli utenti possono creare i propri bot tramite il sito web di Poe o l’app iOS.


Ora vale la pena esplorare 3 funzionalità chiave della piattaforma.

1. Modelli più potenti con input più ampi

Poe.com ha recentemente lanciato nuovi modelli più potenti con finestre di contesto più ampie. Tra questi, spiccano Claude Instant e Claude 2 di Anthropic, con prompt da 100k token, vale a dire circa 75.000 parole (attualmente il limite in ChatGPT è di 4000 token).

Ho fatto un test. Ho preso l’intero testo di un mio vecchio libro sulle bufale che, come vedi, contiene oltre 23.000 parole:

In effetti Claude 2 è riuscito a leggere il testo e ha riassumerlo in bullet point:

2. Caricamento e analisi dei file

Questa funzionalità, disponibile sia su Web che da mobile, permette a chiunque di aggiungere un file a un messaggio su Poe. Il file viene elaborato per estrarne il testo e mostrare il contenuto direttamente al modello come parte della conversazione.
Per esempio ho usato Sage per caricare un PDF (sul Oculus Go e sicurezza) e chiedergli di indicarmi i cinque punti salienti. Ma funziona con tutti i modelli.

3. Analisi URL

L’analisi degli URL, indirizzi di siti Web, funziona in modo simile al caricamento dei file. Basta aggiungere l’indirizzo ai messaggi su Poe. Per esempio ho chiesto a ChatGPT:

Analizza il contenuto del sito https://www.gianluigibonanomi.com/ e proponi un piano editoriale di un mese per promuoverlo. Indica in una tabella canale social (tra LinkedIn, Facebook, Instagram e YouTube), obiettivo del contenuto, esempio del contenuto

Poi ha proposto i contenuti giorno per giorno. Per esempio:

Giorno 10
Canale social: Instagram
Obiettivo del contenuto: Condividere un post sulla gamification
Esempio del contenuto: Condividere una foto che rappresenta la gamification e parlare del progetto Link&Lead, la prima piattaforma di gamification per trasformare i dipendenti e venditori in brand ambassador e social seller.

Scrivimi per organizzare un evento o un corso sull’intelligenza artificiale generativa

Scrivimi mandami un WhatsApp al 339.6325418 per organizzare un corso o una conferenza sull’A.I. generativa.

Inviaci email

La fine dei ragionieri: ChatGPT legge ed analizza i file Excel!

,

Con l’aggiunta del Code Interpreter, uno strumento disponibile solo per la versione a pagamento PLUS di ChatGPT, il celebre chatbot è ora in grado di leggere ed analizzare i file Excel. Questa funzionalità permette a ChatGPT di eseguire codice Python e di interagire direttamente con i file caricati dall’utente, compresi i file CSV ed Excel fino a 100 Mb. Importante sottolineare che questi file non vengono salvati e sono inutilizzabili dopo la sessione.

Le potenzialità sono enormi. L’analisi dei dati, un tempo riservata ai professionisti del settore, è ora alla portata di tutti. Nel video racconto cinque cose che potete fare con i vostri file Excel.

  1. Con pochi comandi, è possibile generare grafici informativi direttamente dai dati del file Excel. Questo può aiutare a visualizzare tendenze e pattern.
  2. L’utente può utilizzare il Code Interpreter per selezionare specifici dati dal file, creando un subset di dati per ulteriori analisi.
  3. Se il file contiene coordinate geografiche, è possibile creare mappe interattive.
  4. Sebbene PowerPoint non sia un formato di file Excel, il Code Interpreter può estrarre il testo da una presentazione, consentendo un’analisi testuale.
  5. Infine, ChatGPT può utilizzare i dati per generare contenuti testuali, come rapporti, articoli, post, tabelle, ecc.

La fine dei ragionieri? Forse no, ma sicuramente l’inizio di una nuova era in cui l’intelligenza artificiale gioca un ruolo sempre più importante soprattutto per chi lavora con i dati.

Guarda il video

Scrivimi per organizzare un evento o un corso sull’intelligenza artificiale generativa

Scrivimi mandami un WhatsApp al 339.6325418 per organizzare un corso o una conferenza sull’A.I. generativa.

Inviaci email