Italiano, come sono andati gli esami dei più importanti modelli di intelligenza artificiale

Non si studia solo inglese

I modelli attualmente disponibili, pur avendo prestazioni elevate in inglese, sono carenti nelle altre lingue. Che sia per la scarsità e la bassa qualità dei dati disponibili o per le dimensioni ridotte della community di contributori, questa situazione non garantisce uguaglianza di opportunità e obbliga a una visione anglo-centrica.

Continuando a valutarli solo con test nati per l’americano e poi tradotti in automatico (e male) in italiano, non se ne viene a capo. Per questo Fabio Mercorio, Mario Mezzanzanica, Daniele Potertì e Antonio Serino e Andrea Seveso hanno pensato di creare in test per lingue diverse dall’inglese. Partendo dalla propria, hanno scelto quello Invalsi, già pronto (o quasi), noto a tutti e funzionale a effettuare paragoni diretti con le performance umane.

I Llm non sanno l’ortografia

“Abbiamo adattato più di 600 domande tipicamente linguistiche, abbiamo creato una ‘classe multilingue’ di Llm allenati sia in italiano che in inglese e, come in ogni classe, abbiamo trovato “studenti” più o meno brillanti” spiega Mercorio. Claude di Anthropic si rivela “il secchione”, il piccolo Google Gemini sembra uno di quegli alunni silenziosamente seduti all’ultimo banco, ma sempre preparati, mentre il modello Minerva sviluppato dalla Università Sapienza di Roma ha ancora molta strada da fare e si sta applicano.

Tra i banchi si è formato anche il gruppo dei “bacchettoni”, quello dei modelli di OpenAI, che ritiene violenti e immorali e i racconti Il padrone della Luna di Gianni Rodari e Le ombre bianche di Ennio Flaviano, rifiutandosi di leggerli.

ESA Space Rider: superato un test per lo scudo termico del nuovo laboratorio spaziale europeo

Feb 25, 2026 | Tecnologia

Nelle scorse settimane una parte del nuovo laboratorio spaziale europeo Space Rider voluto da ESA ha superato un nuovo test dedicato allo scudo termico (TPS). Si avvicina la fase operativa prevista a partire dal 2028. Articolo Originale

Per saperne di più

Intelligenza artificiale e vulnerabilità umana: rischi, responsabilità e nuove strategie per le imprese

Feb 25, 2026 | Tecnologia

L’intelligenza artificiale generativa non è più un semplice strumento di supporto; è diventata un’interfaccia quotidiana che accompagna decisioni personali, finanziarie e sanitarie, spesso nei momenti in cui le persone cercano rassicurazione o orientamento. Ed è…

Per saperne di più

Ci sarà una nuova serie di Evangelion, ecco il primo teaser trailer

Feb 25, 2026 | Tecnologia

In occasione dei festeggiamenti per il trentesimo anniversario di Neon Genesis Evangelion, lo Studio Khara ha annunciato una nuova serie animata del franchise Articolo Originale

Per saperne di più

Esplora il mondo della tecnologia e del lifestyle con Consigli Tech e Lifestyle di Flavio Perrone

Non si studia solo inglese

I Llm non sanno l’ortografia

Written By

Related Posts

ESA Space Rider: superato un test per lo scudo termico del nuovo laboratorio spaziale europeo

Intelligenza artificiale e vulnerabilità umana: rischi, responsabilità e nuove strategie per le imprese

Ci sarà una nuova serie di Evangelion, ecco il primo teaser trailer