Esplorare le funzionalità dell'IA generativa

Obiettivi di apprendimento

Al completamento di questa unità, sarai in grado di:

Descrivere le qualità dei modelli di IA generativa rispetto ad altri modelli.
Definire i principali termini associati ai modelli di linguaggio IA.
Descrivere le funzionalità dell'IA generativa che utilizzano i modelli di linguaggio.

L'intelligenza artificiale sotto i riflettori

Come avrai notato, negli ultimi tempi si parla molto di intelligenza artificiale (IA). Ne siamo quasi sopraffatti. Ma perché all'improvviso tutto questo interesse? L'IA non è esattamente una novità: molte aziende e istituzioni la utilizzano da anni in vari modi. L'improvvisa attenzione per l'IA è stata probabilmente causata da ChatGPT, un chatbot basato sull'IA in grado di fare ciò che nessun altro saprebbe fare.

ChatGPT è in grado di rispondere a domande o richieste in linguaggio normale e le risposte sembrano scritte da un essere umano. E poiché è stato rilasciato al pubblico, tutti hanno potuto sperimentare in prima persona cosa significhi avere una conversazione con un computer. È stato sorprendente. Inquietante. Evocativo. Quindi, naturalmente, ha attirato l'attenzione della gente.

Un allegro robot è seduto su una sedia accanto a una scrivania. Sulla scrivania c'è un computer portatile. Disegnato nello stile di un'immagine vettoriale in 2D.

[Immagine generata da IA usando DreamStudio su stability.ai con il prompt: "A happy robot sitting on a chair at a desk. On the desk is a laptop computer. Drawn in the style of 2D vector artwork" (Un allegro robot è seduto su una sedia accanto a una scrivania. Sulla scrivania c'è un computer portatile. Disegnato nello stile di un'immagine vettoriale in 2D).]

Un'intelligenza artificiale in grado di sostenere una conversazione naturale che somiglia a quella umana è chiaramente diversa da tutto ciò che abbiamo visto in passato. Come puoi scoprire nel badge Nozioni fondamentali sull'intelligenza artificiale, sono moltissime le operazioni specifiche per cui i modelli di IA vengono addestrati. Ad esempio, un modello di IA può essere addestrato a utilizzare i dati di mercato per prevedere il prezzo di vendita ottimale per una casa con tre camere da letto. È notevole, ma quel modello produce "solo" un numero. Al contrario, alcuni modelli di IA possono produrre un'incredibile varietà di testi, immagini e suoni che non abbiamo mai letto, visto o sentito prima. Questo tipo di IA è noto come IA generativa. Ha in sé un enorme potenziale di cambiamento, sia all'interno che all'esterno del luogo di lavoro.

In questo badge scoprirai quali sono i tipi di operazioni per cui vengono addestrati i modelli di IA generativa e alcune delle tecnologie alla base dell'addestramento. Questo badge esplora anche il modo in cui le aziende si stanno raccogliendo intorno a domini di specializzazione nell'ecosistema dell'IA generativa. Infine, vedremo anche alcune delle preoccupazioni che le aziende nutrono nei confronti dell'IA generativa.

Possibilità dei modelli di linguaggio

L'IA generativa potrebbe sembrare una novità assoluta, ma in realtà i ricercatori addestrano modelli di IA generativa da decenni. Alcuni hanno addirittura fatto notizia negli ultimi anni. Forse ricorderai gli articoli del 2018 su un'azienda di nome Nvidia che ha presentato un modello di IA in grado di produrre realistiche immagini fotografiche casuali di volti umani. Le immagini erano sorprendentemente convincenti. E sebbene non fossero perfette, diventarono un argomento di conversazione che destò molto interesse. L'IA generativa stava lentamente iniziando a entrare nella coscienza pubblica.

Mentre i ricercatori lavoravano a un'IA in grado di creare tipi specifici di immagini, altri si concentravano sull'IA legata al linguaggio, addestrando modelli di IA per eseguire ogni tipo di operazione che comportasse l'interpretazione del testo. Supponiamo, ad esempio, che tu voglia classificare le recensioni di uno dei prodotti della tua azienda come positive, negative o neutre. È un'operazione che richiede la comprensione del modo in cui le parole vengono combinate nell'uso quotidiano ed è un ottimo esempio di ciò che gli esperti chiamano elaborazione del linguaggio naturale (NLP, Natural Language Processing). Poiché esistono molti modi di "elaborare" il linguaggio, l'elaborazione del linguaggio naturale descrive un'ampia categoria di IA. Per maggiori informazioni sull'NLP, vedi Nozioni di base sull'elaborazione del linguaggio naturale.

Alcune IA che eseguono l'NLP sono addestrate su enormi quantità di dati, in questo caso campioni di testo scritti da persone reali. Internet, con i suoi miliardi di pagine web, è una grande fonte di dati campione. Poiché questi modelli di IA sono addestrati su quantità enormi di dati, vengono chiamati Large Language Model (LLM, modelli linguistici di grandi dimensioni). Gli LLM catturano in modo incredibilmente dettagliato le regole linguistiche che gli esseri umani impiegano anni ad apprendere. Questi Large Language Model consentono di svolgere operazioni incredibilmente complesse correlate al linguaggio.

Creazione di riassunti

Se ti viene data una frase e capisci in che modo le parole si combinano per esprimere un concetto, probabilmente puoi riscriverla per esprimere la stessa idea. Poiché i modelli di IA conoscono le regole della sintassi e hanno imparato quali parole possono essere scambiate con altre, possono anche rimescolarle. Prendere un intero paragrafo e condensarlo in una o due frasi è un altro tipo di remix. Questo tipo di creazione di riassunti assistita dall'intelligenza artificiale può essere molto utile nel mondo reale, ad esempio per creare le minute di una riunione a partire da una registrazione di un'ora o per scrivere il riassunto di un articolo scientifico. È il generatore di "elevator pitch" per eccellenza.

Traduzione

Gli LLM sono come una raccolta di regole che riguardano il modo in cui una lingua struttura le parole in idee. Ogni lingua ha le sue regole. In inglese, di solito si mettono gli aggettivi prima dei sostantivi, ma in francese è il contrario. I traduttori basati su IA sono addestrati ad apprendere entrambe le regole. Così, quando è il momento di rimescolare una frase, l'IA può utilizzare un secondo insieme di regole per esprimere la stessa idea. Voilà, ecco una traduzione eccellente. Anche i linguaggi di programmazione sono lingue. Hanno un proprio insieme di regole, quindi l'IA può tradurre un insieme di istruzioni in codice vero e proprio. Un programmatore tascabile personale può aprire molte porte a molte persone.

Correzione di errori

Anche gli scrittori più esperti di tanto in tanto commettono errori grammaticali o di ortografia. Ora l'intelligenza artificiale è in grado di rilevare (e talvolta correggere automaticamente) gli eventuali errori. Inoltre, correggere gli errori è importante anche quando si ascolta qualcuno parlare. Si possono perdere alcune parole perché ci si trova in un ambiente rumoroso, ma si usa il contesto per colmare le lacune. L'IA è in grado di fare anche questo, rendendo ancora più accurate le applicazioni di riconoscimento vocale, come quelle per la creazione di sottotitoli.

Risposta a domande

È il tipo di operazione che ha portato l'IA generativa alla ribalta. Le IA come ChatGPT sono in grado di interpretare l'intenzione di una domanda o una richiesta. Poi, possono generare una grande quantità di testo in base alla richiesta. Ad esempio, se chiedessi di riassumere in una sola frase le tre opere più popolari di William Shakespeare, il risultato sarebbe:

"Romeo e Giulietta": la tragica storia di due giovani amanti di famiglie in lotta tra loro, il cui amore li porta a una morte prematura.

"Amleto": la storia di un principe perseguitato dal fantasma del padre, alle prese con la vendetta e le questioni esistenziali della vita e della morte.

"Macbeth": un dramma agghiacciante sull'ambizione e il declino morale di un nobile che, spinto dall'ambizione della moglie, cede a un sanguinoso percorso di omicidi per impossessarsi del trono.

Poi, potresti continuare la conversazione chiedendo ulteriori informazioni su Amleto, come se stessi parlando con il tuo insegnante di Lettere. Questo tipo di interazione è un ottimo esempio di come ottenere informazioni tempestive con una semplice richiesta.

Generazione guidata di immagini

Gli LLM possono essere utilizzati in combinazione con modelli di generazione di immagini, in modo che tu possa descrivere l'immagine desiderata e che l'intelligenza artificiale tenti di crearla per te. Ecco un esempio di richiesta: "un disegno tipo line art in 2D di Giulietta in piedi alla finestra di un antico castello". Poiché su Internet sono disponibili numerose descrizioni e immagini di Romeo e Giulietta, il generatore IA non ha avuto bisogno di ulteriori informazioni per indovinare un'immagine appropriata.

Un disegno tipo line art in 2D di Giulietta in piedi alla finestra di un antico castello.

[Immagine generata da IA usando DreamStudio su stability.ai con il prompt "A 2D line art drawing of Juliet standing in the window of an old castle" (Un disegno tipo line art in 2D di Giulietta in piedi alla finestra di un antico castello).]

In relazione alla generazione guidata di immagini, alcuni modelli di IA possono aggiungere nuovi contenuti a immagini esistenti. Ad esempio, è possibile estendere i bordi di un'immagine, consentendo all'IA di disegnare ciò che è probabile che appaia in base al contesto dell'immagine originale.

Sintesi vocale

Analogamente al modo in cui l'IA converte una stringa di parole in un'immagine, esistono modelli di IA in grado di convertire il testo in parlato. Alcuni modelli possono analizzare campioni audio di una persona che parla. Imparano i modelli vocali unvoci di quella persona e possono riprodurli quando convertono un testo in nuovo audio. Per un ascoltatore occasionale è difficile trovare la differenza.

Questi sono solo alcuni esempi di come è possibile utilizzare gli LLM per creare nuovi testi, immagini e suoni. Quasi tutte le operazioni che si basano sulla comprensione del funzionamento del linguaggio possono essere ampliate da un'intelligenza artificiale. È uno strumento incredibilmente potente che si può usare sia per il lavoro che per il divertimento.

Previsioni sorprendenti

Ora che hai un'idea di ciò che l'IA generativa è in grado di fare, è importante chiarire una cosa. Il testo generato da un'intelligenza artificiale generativa è in realtà un'altra forma di previsione. Ma anziché prevedere il valore di una casa, prevede una sequenza di parole che probabilmente avranno un significato e una rilevanza per il lettore.

Le previsioni sono certamente affascinanti, ma non indicano che il computer sta "pensando". Il computer non ha un'opinione sull'argomento richiesto, né ha intenzioni o desideri propri. Se sembra che abbia un'opinione, è perché sta facendo la migliore previsione di ciò che ci si aspetta come risposta. Ad esempio, chiedendo a qualcuno "Preferisci il caffè o il tè?" si ottiene un certo tipo di risposta prevista. Un modello ben addestrato è in grado di prevedere una risposta, anche se non ha senso che un computer desideri qualsiasi tipo di bevanda.

Nella prossima unità scoprirai alcune delle tecnologie che rendono possibile l'IA generativa.

Tempo stimato

Argomenti

Hai bisogno di aiuto?

Risorse per Einstein