AI Overview sbaglia lo spelling perché i modelli non leggono lettere ma token. Ecco cosa significa.
Negli ultimi giorni si è parlato molto di un comportamento curioso dell’intelligenza artificiale di Google: il sistema AI Overview, integrato nel motore di ricerca, a volte sbaglia a scrivere persino parole comunissime, come “Google”. Un errore che ha fatto sorridere molti utenti, ma che in realtà nasconde un funzionamento molto diverso da quello che immaginiamo.
In questo articolo ti spiego in modo semplice perché accade, cosa sono i “token” di cui tanto si parla e perché questi errori non significano che l’AI “non sa leggere”, ma che lavora con logiche completamente diverse dalle nostre.
Perché l’AI non ragiona come noi
Quando leggiamo una parola, la riconosciamo lettera per lettera, la confrontiamo con quelle già conosciute e la ricostruiamo mentalmente. Un modello linguistico, invece, non ragiona sul singolo carattere: non “vede” le lettere, ma i token.
Che cosa sono i token
I token sono unità minime di testo che un modello linguistico utilizza per capire e generare contenuti. Non corrispondono sempre alle lettere o alle parole intere. A volte possono essere:
- parole complete, come “casa”
- parti di parola, come “go”, “ogle”, “tion”
- simboli, numeri o spazi
Il modello quindi non elabora il testo come una sequenza di lettere, ma come una sequenza di token predefiniti. Questo significa che, quando deve generare una parola, non ricostruisce le lettere dall’inizio: sceglie la combinazione di token che gli sembra più probabile in quel contesto.
Perché AI Overview ha scritto male “Google”
Secondo le prime analisi degli esperti, l’errore nasce dal modo in cui il modello gestisce i token associati alla parola “Google”. Se una parte di questi token è poco usata o ha associazioni particolari, il sistema può produrre una variante sbagliata, come “Goolge” o “Googole”.
Non è un errore “di distrazione” e non indica che il modello non conosce la parola. È un effetto collaterale del modo in cui calcola la probabilità di ogni token quando genera una risposta.
Quando questi errori si presentano più facilmente
Gli errori di spelling nei modelli linguistici possono comparire in situazioni specifiche, ad esempio:
- quando la parola contiene token inusuali
- quando ci sono molte varianti simili
- quando il modello tenta di parafrasare troppo rapidamente
- quando la risposta viene generata in modo “creativo” e non esatto
È raro che accada su parole molto comuni, ma non impossibile, come abbiamo visto nel caso di Google stesso.
È un problema serio?
Per la maggior parte degli utenti no: si tratta di un errore minore e soprattutto facilmente risolvibile. Tuttavia, Google sta già lavorando per migliorare la gestione dei token e ridurre questi casi, soprattutto nelle risposte che compaiono direttamente nei risultati di ricerca.
Per chi usa quotidianamente strumenti basati su modelli linguistici, è utile ricordare che:
- gli errori di spelling non indicano scarsa qualità dei dati
- dipendono dalla tokenizzazione, non dalla conoscenza
- vengono corretti man mano che i modelli vengono ottimizzati
Cosa possiamo imparare da questo episodio
La vicenda dimostra quanto sia importante capire come funzionano davvero le AI. Non sono macchine che “leggono” o “pensano” come noi: seguono regole matematiche e statistiche che, a volte, producono risultati inattesi. Conoscere il concetto di token ci aiuta a interpretare questi errori senza attribuire loro significati sbagliati.
In conclusione, l’AI di Google non sbaglia perché “non sa scrivere”, ma perché i modelli linguistici operano su livelli diversi dalle lettere e dalle parole. E mentre le tecnologie evolvono, imparare come funzionano ci permette di usarle in modo più consapevole.
