EngGPT2: L'Intelligenza Artificiale Italiana dal Prezzo di Mezzo Milione Il recente lancio di EngGPT2-16B-A3B da parte di Engineering Group segna un passo significativo nel panorama dell'intelligenza artificiale italiana. Con un costo di 500.000 euro per il training, questo modello da…
EngGPT2: L’Intelligenza Artificiale Italiana dal Prezzo di Mezzo Milione
Il recente lancio di EngGPT2-16B-A3B da parte di Engineering Group segna un passo significativo nel panorama dell’intelligenza artificiale italiana. Con un costo di 500.000 euro per il training, questo modello da 16 miliardi di parametri rappresenta una proposta competitiva nel settore, puntando non solo a soddisfare le esigenze di mercato, ma anche a promuovere l’idea di un’AI sovrana europea.
Investimenti e Sostenibilità: Un Modello Alternativo
L’investimento di 500.000 euro per sviluppare EngGPT2 non è solo una cifra; è un segnale politico forte. Il suo training ha richiesto 250.000 ore su GPU, attraverso un totale di 2,5 trilioni di token, con un chiaro allineamento agli standard europei come l’AI Act. Questa scelta non solo evidenzia una strategia economica realistica, ma mostra anche che è possibile sviluppare un’AI di qualità senza dover competere con budget stratosferici tipici dei giganti statunitensi e cinesi. EngGPT2 si posiziona così come un modello accessibile per le aziende nazionali e i centri di ricerca, dimostrando che l’innovazione può avvenire con risorse realistiche.
Architettura e Innovazione: Un Modello Efficiente
EngGPT2 si distingue anche per la sua architettura MoE (Mixture-of-Experts), progettata per ottimizzare performance e costi. Con 24 layer e 64 esperti per livello, di cui solo otto attivati per token, il modello riesce a mantenere un buon rapporto costo-capacità. Inoltre, i dati utilizzati nel pre-training includono un 25% di contenuti italiani, un aspetto raro in modelli simili e cruciale per soddisfare le specifiche esigenze linguistiche e culturali del mercato locale. Tale attenzione permette alle aziende italiane di beneficiare di un modello che parla la propria lingua, limitando i rischi normativi e garantendo una maggiore compliance alle leggi europee.
Quattro Modalità di Ragionamento: Versatilità per il Mercato
Una delle innovazioni più interessanti di EngGPT2 è l’inclusione di quattro modalità di ragionamento, attivabili tramite token specifici. Questa flessibilità consente un utilizzo adatto a diverse applicazioni, rendendo il modello estremamente versatile per chi opera in settori come il customer care o la sintesi documentale. Tuttavia, con questa versatilità emergono anche delle problematiche. I dati mostrano che in modalità compressa, il modello tende a seguire la lingua del prompt anziché una selezione prestabilita, potenzialmente generando inconvenienti in situazioni di compliance normativa, un aspetto che le aziende devono considerare.
Conclusione: Un Passo Verso la Sovranità
Nel contesto italiano, l’introduzione di EngGPT2 offre una base concreta per avviare un’importante conversazione su come sviluppare un ecosistema di AI sovrano. I dati forniti non solo ancorano le discussioni a parametri verificabili, ma suggeriscono anche che iniziative nazionali possono coesistere e prosperare. È fondamentale, ora più che mai, che queste iniziative siano integrate in un quadro riconoscibile per trasformare la frammentazione in un sistema coerente e strategico. Al di là del prezzo e della tecnologia, la vera sfida rimane quella di come coordinare e capitalizzare su queste innovazioni per costruire una filiera italiana forte e sostenibile nel campo dell’intelligenza artificiale.
