Seleziona una pagina
sabato, Feb 10

Intelligenza artificiale, un modello linguistico che parla italiano



Da Wired.it :

Si chiama Magiq ed è un Llm, cioè un large language model per addestrare l’intelligenza artificiale, specializzato nella lingua italiana. Ne hanno appena annunciato il lancio My Maia, un’azienda statunitense attiva nel campo dell’AI, e la società italiana di ricerca e sviluppo Synapsia. Entrambe sono controllate dalla holding Dt Socialize e sono impegnate da tempo nello sviluppo della piattaforma Maia life copilot. L’idea è fare un primo passo nell’adattare i modelli di base per l’AI – e non i chatbot che ne rappresentano in qualche modo lo stadio finale – alle peculiarità linguistiche e culturali nazionali.

Maia life copilot è un’applicazione di intelligenza artificiale che mira a fornire una iper-personalizzazione dell’esperienza utente. Diversamente da soluzioni generaliste come ChatGPT, Maia si concentra su un’assistenza altamente personalizzata nella vita quotidiana degli utenti, utilizzando una rete neurale dedicata all’autoprofilazione (Neural Id) che le permette di fornire risposte e suggerimenti basati sul contesto specifico e sulle caratteristiche individuali dell’utente – spiega Stefano Mancuso, direttore operativo di Synapsia, a Wired -. Magiq, invece, è un modello di base per l’intelligenza artificiale, rilasciato in open source, che fornisce capacità di ragionamento a prodotti come Maia e che è uno dei modelli di AI principali dell’hub cognitivo dell’intero progetto”. Se Maia Life Copilot rappresenta quindi l’applicazione pratica dell’AI nel quotidiano, Magiq è il motore di intelligenza artificiale che sta dietro a questa applicazione.

Stefano Mancuso, direttore operativo di Synapsia

Come si costruisce un Llm in italiano?

Frutto della raccolta di 7 mesi di dati su Maia life copilot, Magiq sarà disponibile in open-source su Hugging Face, società franco-americana che ha prodotto una piattaforma AI tra le più potenti in circolazione, aprendo nuove strade per lo sviluppo di modelli con caratteristiche linguistiche e culturali specifiche.Sviluppare un large language model in italiano presenta sfide uniche legate alla raccolta e al trattamento dei dati. L’obiettivo è creare un modello che non solo comprenda e generi la lingua italiana ma che rifletta anche le sue specifiche sfumature culturali e colloquiali”, aggiunge Mancuso.

Lo sviluppo si è articolato in diversi passaggi. Anzitutto nella raccolta dei dati, milioni di esempi di testo che coprano un’ampia varietà di argomenti, stili e contesti da numerose fonti come libri, articoli, siti web, trascrizioni di conversazioni e altro. Era essenziale che queste fonti fossero il più variegate possibile per catturare la ricchezza della lingua e della cultura italiana. Poi la pulizia e la preparazione dei dati con la rimozione di errori, contenuti non pertinenti o sensibili e la standardizzazione dei formati. Dopo l’addestramento iniziale, il modello è stato testato e valutato per assicurarsi che producesse output accurati e pertinenti. Un processo che ha richiesto un team multidisciplinare con esperti in linguistica, cultura italiana e intelligenza artificiale. Il 30 marzo terminerà infatti la fase alpha in cui un gruppo selezionato di utenti italiani, francesi e statunitensi ha fornito dati e feedback fondamentali per l’affinamento del modello Magiq e il perfezionamento di Maia. Synapsia ha la sua sede principale a Milano e un ufficio a Foligno ed è stata fondata nel 2022 con l’obiettivo specifico di sviluppare il progetto Maia. Specializzata in ricerca e sviluppo nel campo dell’intelligenza artificiale, conta su un team di circa 30 professionisti tra cui linguisti e informatici. Come raccontato da Milano Finanza, la holding che la controlla, Dt Socialize, è pronta alla quotazione al listino Euronexxt di Parigi a febbraio.

La sfida dell’intelligenza artificiale generale

Sviluppare modelli di intelligenza artificiale specializzati, anche a livello linguistico, ponendosi come obiettivo finale la realizzazione un’intelligenza artificiale generale (Agi) – ovvero che raggiungere il livello di quella umana – è una sfida davvero complessa. “L’intelligenza umana è sfaccettata, comprendendo varie forme come l’intelligenza matematica, musicale, linguistica ed emotiva – spiega Mancuso –. I modelli di AI attuali sono molto efficaci nel compiere specifici compiti, superando in alcuni casi le capacità umane. Tuttavia, questa efficienza non equivale a vera intelligenza, poiché questi modelli sono limitati a compiti specifici”.

Un aspetto fondamentale da implementare in una AI se si aspira a emulare le capacità umane è la capacità di astrazione, cioè di formulare concetti e teorie astratte: “Al momento, nessun modello AI ha raggiunto questo livello di complessità cognitiva – dice Mancuso –, l’obiettivo non è necessariamente raggiungere una comprensione completa equivalente all’intelligenza umana ma avvicinarsi progressivamente a questa meta, migliorando le capacità di ragionamento e astrazione dei modelli AI”. Anche se focalizzato inizialmente sull’italiano – conclude il direttore operativo –, Maia opera anche in inglese e francese, ampliando così la sua portata a mercati più vasti e diversificati e applicando lo stesso approccio tecnologico a diversi idiomi”. La scelta di iniziare con l’italiano, spiega l’esperto, rientra in una visione strategica vista la complessità e la ricchezza della lingua e della cultura italiana. Nonostante il numero di italofoni sia relativamente limitato a livello globale (circa 60 milioni), l’italiano ha un’importanza culturale e storica significativa.



[Fonte Wired.it]