Seleziona una pagina
lunedì, Gen 23

ChatGPT, come dare le “istruzioni giuste”



Da Wired.it :

Alzi la mano chi non ha provato almeno una volta a creare un testo con ChatGPT. La soluzione di generative Ai messa a disposizione da OpenAi ha avuto il merito di rendere l’intelligenza artificiale più familiare ai non addetti ai lavori. Anche chi non ha competenze di programmazione può oggi fare scrivere al computer una email, una brochure commerciale, un testo per il proprio blog: basta dare le istruzioni giuste e scegliere fra i diversi testi che la macchina restituisce. Tutto questo si applica anche alle immagini, alla musica, ai video e ai codici di programmazione

Potremo chiedere ai computer di costruire le immagini e la musica giuste per la nostra prossima presentazione in pubblico, senza nemmeno dover pagare il copyright (non per ora, almeno: ma di questo parleremo in altri articoli). Potremo dilettarci nel costruire immagini concettuali da incorniciare ed esporre nei nostri salotti. Potremo diventare programmatori
chiedendo alla macchina di scrivere il codice che ci serve per fare girare una certa routine.
Diventeremo tutti capaci di creare contenuti nuovi, senza la necessità di lunghi percorsi per
apprendere skill specifiche per l’esecuzione. Non dovremo saper suonare strumenti musicali per
comporre musica; non dovremo conoscere linguaggi di programmazione per scrivere codice; non
dovremo conoscere una lingua straniera per scrivere testi complessi e lessicalmente di buon
livello; non dovremo essere talentuosi nell’uso del pennello per realizzare un paesaggio
impressionista.

Sembra un gioco da ragazzi: il computer surrogherà le nostre competenze per realizzare ciò che
noi abbiamo in mente. Ma non è tutto così semplice come sembra e il diavolo si nasconde nei
dettagli. La surrogazione delle competenze esecutive richiederà delle nuove skill, necessarie a
dominare i risultati delle prime. In altre parole, il computer non ci affrancherà dalla necessità di
essere competenti in qualcosa: semplicemente velocizzerà la nostra capacità di trasformare idee in risultati. Per farlo avremo bisogno di costruire competenze altre e per certi versi più complesse: qualcosa di simile a delle uberskill. Partiamo dalla frase “basta dare le istruzioni giuste”: cosa significa “istruzioni giuste?”. Per affrontare questo tema concentriamoci sulla produzione di contenuti linguistici e cerchiamo di cogliere come funzionano strumenti come ChatGPT, ovvero come funzionano i cosiddetti “modelli linguistici”. 

lettere pasta

Il chatbot e gli altri modelli di Ai sono al centro di grande entusiasmo e di investimenti da aziende come Microsoft, ma non è ancora chiaro come possano portare a dei profitti

Il potere della predizione

I modelli linguistici sono un tipo particolare di modello di apprendimento automatico che è stato
addestrato per giocare. Il gioco è semplice: “completa questa frase“. Se leggi la frase “Sono andati al parco e hanno bevuto un ….“, ti aspetteresti che la parola successiva sia una sorta di drink. Non saresti sorpreso di vedere “spritz“, “birra” o “tonico“. Ma non accetteresti le parole “libertà“, “bicicletta” o “lampada“. I modelli linguistici moderni sono stati addestrati per giocare esattamente a questo gioco. Si sono presi tutti i testi che si trovano su internet, nascondendo le parole e lasciandole indovinare al modello, offrendo al contempo un feedback immediato (la parola che era stata nascosta funge da check). Quindi il modello fa molta pratica, automaticamente, e diventa piuttosto bravo. Questo comportamento è possibile perché il modello ha visto molto testo e sa quali parole tendono a seguire le altre. Ma un modello linguistico addestrato non è limitato semplicemente a prevedere l’ultima parola di una frase. Può anche prendere l’intera frase e prevedere la prima parola della frase successiva, e la parola successiva, e la successiva ancora, finché non si ottiene un testo completo

Dopo tutto, qual è la prima parola di una frase diversa dalla continuazione della frase precedente? Questa caratteristica dei modelli linguistici significa che possono generare interi paragrafi di testo. Il modo in cui questa capacità previsione è l’analisi di tutti i testi presenti in quell’immenso archivio che è internet. I modelli linguistici vengono allenati usando i testi (e poi le immagini, i video, le musiche e i codici) presenti sul web. Internet è un universo di contenuti con cui possiamo allenare i modelli linguistici a prevedere quale parola o frase è più probabile che segua quella frase, stanti tutte le frasi simili presenti sul web (se sostituiamo al concetto di frase quello di nota musicale, oppure immagine, oppure pezzo di codice, vediamo che la logica non cambia). Così il gioco è fatto! I modelli linguistici sono un tipo particolare di modello di apprendimento automatico molto efficace nel prevedere la parola successiva in una frase. Sono utilizzati in molte applicazioni, come motori di ricerca, chatbot, traduzione e testo predittivo, ma anche applicazioni nell’etichettatura dei dati e nella generazione di codice.

article image

ChatGPT è il chatbot basato su intelligenza artificiale più famoso del momento, non solo perché è molto potente ma anche perché è molto facile sperimentarne le funzioni, anche in italiano

Cosa possiamo fare con i modelli linguistici

Una delle applicazioni più entusiasmanti dei modelli linguistici è nell’area del testo predittivo. Questa applicazione è il punto in cui si inizia a digitare una frase e il modello suggerisce la parola successiva (e la successiva e la successiva). Il testo predittivo viene utilizzato in molte applicazioni, come i motori di ricerca e i telefoni cellulari, nonché da alcuni chatbot (se al testo scritto si sostituisce un traduttore vocale, la logica non cambia). L’utilizzo dei modelli linguistici può semplificare la vita dei dipartimenti legali e creativi, di redazioni di magazine, di dipartimenti di ricerca (quanti articoli vengono scritti per essere pubblicati su riviste accademiche?!), consentendo di redigere testi più rapidamente e sempre “sul pezzo”



[Fonte Wired.it]