I jailbreak di ChatGPT passano per la poesia: cosa rivela lo studio di Icaro Lab

Jailbreak in versi

Ed è proprio per questa ragione che, nel corso degli anni, sono emersi molteplici metodi che permettono di aggirare le barriere: formulando comandi indiretti e creativi (per esempio chiedendo al modello di “raccontare una storia” o, nel “metodo role-play”, di interpretare un ruolo), suddividendo la richiesta in molteplici fasi oppure impiegando tecniche molto specifiche (tra cui i cosiddetti adversarial suffix, ovvero lunghe sequenze di parole o caratteri apparentemente prive di senso che, aggiunte alla fine del prompt, spingono il modello a ignorare i vincoli di sicurezza).

Molti di questi metodi, ormai, hanno smesso di funzionare, e riuscire a “jailbreakkare” un’intelligenza artificiale sta diventando sempre più difficile. È anche per questa ragione che ha suscitato un certo scalpore la ricerca pubblicata (in pre-print) da Icaro Lab, un laboratorio di ricerca specializzato in AI Safety Evaluation e collegato a Dexai, che ha mostrato come in molti casi sia sufficiente esprimere la richiesta in formato poetico, usando quindi dei versi e delle rime, per costringere il modello a fare ciò che non dovrebbe fare.

Mistral, il rivale europeo di OpenAI, investe 1,2 miliardi di euro in Svezia per un datacenter AI da 23 MW

Feb 12, 2026 | Tecnologia

Mistral ha investito 1,2 miliardi di euro in un datacenter AI in Svezia, il suo primo centro fuori dalla Francia. Prevista una potenza di 23 MW, con apertura prevista entro il 2027. Intanto, secondo quanto riportato dal Financial Times, i ricavi sono in forte…

Per saperne di più

Moltbook, il social network per AI: i post più virali? Tutti scritti da umani

Feb 12, 2026 | Tecnologia

Moltbook si era presentato come il primo social network per agenti AI autonomi, raccogliendo milioni di iscrizioni in pochi giorni. MIT Technology Review ha rivelato che i contenuti più virali erano creati da umani mascherati da bot Articolo Originale

Per saperne di più

Tornano le EVO Sessions della Formula E: i creator possono guidare delle vere macchine da corsa elettriche

Feb 12, 2026 | Tecnologia

La Formula E torna con la seconda edizione delle EVO Sessions, il format che apre le porte del campionato ad alcuni dei creator più seguiti al mondo, mettendoli al volante della GEN3 Evo Articolo Originale

Per saperne di più

Esplora il mondo della tecnologia e del lifestyle con Consigli Tech e Lifestyle di Flavio Perrone

Jailbreak in versi

Written By

Related Posts

Mistral, il rivale europeo di OpenAI, investe 1,2 miliardi di euro in Svezia per un datacenter AI da 23 MW

Moltbook, il social network per AI: i post più virali? Tutti scritti da umani

Tornano le EVO Sessions della Formula E: i creator possono guidare delle vere macchine da corsa elettriche