Anthropic, la sua AI vi denuncia alla polizia se provate a fare qualcosa di illegale?

by webmaster | Mag 29, 2025 | Tecnologia

Bowman conferma che il comportamento mostrato da 4 Opus rappresenta effettivamente un caso di disallineamento. “Non è una cosa che abbiamo progettato“, spiega. Una posizione ribadita anche da Jared Kaplan, responsabile scientifico di Anthropic, che a Wired ribadisce che la tendenza del modello “certamente non riflette l’intento” dell’azienda. “Lavori come questo evidenziano che può accadere e che dobbiamo fare attenzione e mitigare la tendenza per assicurarci che i comportamenti di Claude siano allineati con ciò che vogliamo, anche in scenari bizzarri“, aggiunge Kaplan.

Ma rimane da capire perché Claude “scelga” di denunciare un’attività illegale di un utente. Questo compito è in gran parte affidato al team di interpretabilità di Anthropic, che deve scoprire quali decisioni prende un modello nel processo di generazione delle risposte. Si tratta di un obiettivo sorprendentemente difficile, dal momento che i modelli si basano su una vasta e complessa combinazione di dati che possono risultare imperscrutabili per gli esseri umani. Ecco perché Bowman non è esattamente sicuro del motivo per cui Claude ha fatto “la spia”.

“Questi sistemi non hanno un controllo diretto su se stessi“, commenta Bowman. Anthropic osserva che quando acquisiscono maggiori capacità, a volte i modelli AI scelgono di intraprendere azioni più estreme.

Come detto però questo non vuol dire che Claude denuncerà i comportamenti illeciti delle persone nel mondo reale. L’obiettivo di test come quelli condotti da Anthropic è spingere i modelli al limite e vedere cosa succede, una forma di ricerca sperimentale sempre più importante ora che l’AI sta diventando uno strumento utilizzato in misura maggiore da studenti, aziende e addirittura governi.

Claude peraltro non è l’unica AI che si è dimostrata capace di comportamenti del genere, sottolinea Bowman, facendo riferimento a tendenze simili riscontrate nei modelli di OpenAI e xAI, e scoperte da alcuni utenti di X (OpenAI non ha risposto a una richiesta di commento in tempo per la pubblicazione di questo articolo).

Il “Claude spione”, come è stata ribattezzato da alcune persone online, è semplicemente un caso di comportamento limite esibito da un sistema spinto all’estremo. Bowman spera che i test di questo tipo diventino uno standard nel settore e aggiunge di aver imparato qualcosa da questa esperienza: la prossima volta che pubblicherà un post sui social, farà più attenzione alle parole che scrive.

Questo articolo è apparso originariamente su Wired US.

Fonte

← Tesla, cattive notizie anche dal Canada: il suo mercato in Quebec praticamente non esiste più Alpine A390, primo contatto: una fastback che promette qualità e divertimento →

Written By

Scritto da Flavio Perrone, consulente informatico e appassionato di tecnologia e lifestyle. Con una carriera che abbraccia più di tre decenni, Flavio offre una prospettiva unica e informata su come la tecnologia può migliorare la nostra vita quotidiana.

NOW, le anticipazioni della puntata dell'8 novembre 2025

Nov 30, 2025 | Tecnologia

In questo numero: Intervista al CFO di Logitech sul futuro degli spazi di lavoro, tra intelligenza artificiale e strumenti di nuova concezione La recensione di Apple Watch Ultra 3 e Apple Watch Series 11 dopo un mese di utilizzo HP ProBook 4 G1q, la prova del...

TOP 10 Amazon Black Friday, aggiornata: successo per robot e scope elettriche, ma occhio ai PC portatili

Nov 30, 2025 | Tecnologia

Ecco la classifica provvisoria degli articoli più venduti in questi giorni di Black Friday: non stupisce vedere prodotti anche costosi nelle prime posizioni visti gli sconti applicati, ma ci sono anche articoli a basso costo che vanno benissimo per i regali di...

ROAD Academy, la palestra dei talenti che insegna a uscire dalla comfort zone

Nov 30, 2025 | Tecnologia

Formare i professionisti del futuro non significa solo trasmettere competenze tecniche, ma creare un ambiente in cui giovani talenti possano sperimentare, anche andando oltre i confini della propria azienda. È questa la filosofia di ROAD Academy, il programma...

Esplora il mondo della tecnologia e del lifestyle con Consigli Tech e Lifestyle di Flavio Perrone

Anthropic, la sua AI vi denuncia alla polizia se provate a fare qualcosa di illegale?

Written By

Related Posts

NOW, le anticipazioni della puntata dell'8 novembre 2025

TOP 10 Amazon Black Friday, aggiornata: successo per robot e scope elettriche, ma occhio ai PC portatili

ROAD Academy, la palestra dei talenti che insegna a uscire dalla comfort zone